DewiBrynJones
/

wav2vec2-xlsr-53-ft-btb-ccv-cy

@@ -2,8 +2,6 @@
 license: apache-2.0
 base_model: facebook/wav2vec2-large-xlsr-53
 tags:
-- automatic-speech-recognition
-- DewiBrynJones/banc-trawsgrifiadau-bangor-clean-with-ccv
 - generated_from_trainer
 metrics:
 - wer
@@ -17,10 +15,10 @@ should probably proofread and complete it, then remove this comment. -->
 # wav2vec2-xlsr-53-ft-btb-ccv-cy
-This model is a fine-tuned version of [facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53) on the DEWIBRYNJONES/BANC-TRAWSGRIFIADAU-BANGOR-CLEAN-WITH-CCV - DEFAULT dataset.
 It achieves the following results on the evaluation set:
 - Loss: inf
-- Wer: 0.9913
 ## Model description
@@ -40,74 +38,54 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0003
-- train_batch_size: 32
-- eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- lr_scheduler_warmup_steps: 500
-- training_steps: 10000
 - mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch  | Step  | Validation Loss | Wer    |
-|:-------------:|:------:|:-----:|:---------------:|:------:|
-| No log        | 0.1544 | 200   | inf             | 1.0    |
-| No log        | 0.3089 | 400   | inf             | 0.8748 |
-| 3.7622        | 0.4633 | 600   | inf             | 0.6794 |
-| 3.7622        | 0.6178 | 800   | inf             | 0.5749 |
-| 0.8615        | 0.7722 | 1000  | inf             | 0.5193 |
-| 0.8615        | 0.9266 | 1200  | inf             | 0.5194 |
-| 0.8615        | 1.0811 | 1400  | inf             | 0.4780 |
-| 0.6742        | 1.2355 | 1600  | inf             | 0.4447 |
-| 0.6742        | 1.3900 | 1800  | inf             | 0.4284 |
-| 0.5813        | 1.5444 | 2000  | inf             | 0.4190 |
-| 0.5813        | 1.6988 | 2200  | inf             | 0.4160 |
-| 0.5813        | 1.8533 | 2400  | inf             | 0.4126 |
-| 0.568         | 2.0077 | 2600  | inf             | 0.3879 |
-| 0.568         | 2.1622 | 2800  | inf             | 0.3813 |
-| 0.4909        | 2.3166 | 3000  | inf             | 0.3892 |
-| 0.4909        | 2.4710 | 3200  | inf             | 0.4132 |
-| 0.4909        | 2.6255 | 3400  | inf             | 0.5342 |
-| 0.5703        | 2.7799 | 3600  | inf             | 0.5749 |
-| 0.5703        | 2.9344 | 3800  | inf             | 0.7368 |
-| 1.1938        | 3.0888 | 4000  | inf             | 0.8357 |
-| 1.1938        | 3.2432 | 4200  | inf             | 0.8130 |
-| 1.1938        | 3.3977 | 4400  | inf             | 0.6570 |
-| 1.1654        | 3.5521 | 4600  | inf             | 0.5719 |
-| 1.1654        | 3.7066 | 4800  | inf             | 0.6034 |
-| 1.0408        | 3.8610 | 5000  | inf             | 0.6953 |
-| 1.0408        | 4.0154 | 5200  | inf             | 0.9980 |
-| 1.0408        | 4.1699 | 5400  | inf             | 0.9477 |
-| 1.7263        | 4.3243 | 5600  | inf             | 0.9963 |
-| 1.7263        | 4.4788 | 5800  | inf             | 0.9998 |
-| 2.8212        | 4.6332 | 6000  | inf             | 0.9976 |
-| 2.8212        | 4.7876 | 6200  | inf             | 0.9959 |
-| 2.8212        | 4.9421 | 6400  | inf             | 0.9917 |
-| 2.7652        | 5.0965 | 6600  | inf             | 0.9897 |
-| 2.7652        | 5.2510 | 6800  | inf             | 0.9902 |
-| 2.7358        | 5.4054 | 7000  | inf             | 0.9889 |
-| 2.7358        | 5.5598 | 7200  | inf             | 0.9905 |
-| 2.7358        | 5.7143 | 7400  | inf             | 0.9887 |
-| 2.7122        | 5.8687 | 7600  | inf             | 0.9878 |
-| 2.7122        | 6.0232 | 7800  | inf             | 0.9847 |
-| 2.7345        | 6.1776 | 8000  | inf             | 0.9842 |
-| 2.7345        | 6.3320 | 8200  | inf             | 0.9882 |
-| 2.7345        | 6.4865 | 8400  | inf             | 0.9872 |
-| 3.035         | 6.6409 | 8600  | inf             | 0.9921 |
-| 3.035         | 6.7954 | 8800  | inf             | 0.9906 |
-| 3.688         | 6.9498 | 9000  | inf             | 0.9916 |
-| 3.688         | 7.1042 | 9200  | inf             | 0.9906 |
-| 3.688         | 7.2587 | 9400  | inf             | 0.9908 |
-| 3.7017        | 7.4131 | 9600  | inf             | 0.9912 |
-| 3.7017        | 7.5676 | 9800  | inf             | 0.9913 |
-| 3.7327        | 7.7220 | 10000 | inf             | 0.9913 |
 ### Framework versions
-- Transformers 4.41.2
-- Pytorch 2.3.1+cu121
-- Datasets 2.20.0
 - Tokenizers 0.19.1

 license: apache-2.0
 base_model: facebook/wav2vec2-large-xlsr-53
 tags:
 - generated_from_trainer
 metrics:
 - wer
 # wav2vec2-xlsr-53-ft-btb-ccv-cy
+This model is a fine-tuned version of [facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: inf
+- Wer: 0.3264
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 0.0003
+- train_batch_size: 16
+- eval_batch_size: 64
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 600
+- training_steps: 6000
 - mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch  | Step | Validation Loss | Wer    |
+|:-------------:|:------:|:----:|:---------------:|:------:|
+| No log        | 0.0772 | 200  | inf             | 1.0    |
+| No log        | 0.1544 | 400  | inf             | 0.8963 |
+| 3.9177        | 0.2317 | 600  | inf             | 0.7595 |
+| 3.9177        | 0.3089 | 800  | inf             | 0.7512 |
+| 0.9791        | 0.3861 | 1000 | inf             | 0.5984 |
+| 0.9791        | 0.4633 | 1200 | inf             | 0.5868 |
+| 0.9791        | 0.5405 | 1400 | inf             | 0.5255 |
+| 0.805         | 0.6178 | 1600 | inf             | 0.5282 |
+| 0.805         | 0.6950 | 1800 | inf             | 0.4769 |
+| 0.7184        | 0.7722 | 2000 | inf             | 0.4743 |
+| 0.7184        | 0.8494 | 2200 | inf             | 0.4680 |
+| 0.7184        | 0.9266 | 2400 | inf             | 0.4570 |
+| 0.6704        | 1.0039 | 2600 | inf             | 0.4253 |
+| 0.6704        | 1.0811 | 2800 | inf             | 0.4164 |
+| 0.5664        | 1.1583 | 3000 | inf             | 0.4159 |
+| 0.5664        | 1.2355 | 3200 | inf             | 0.3995 |
+| 0.5664        | 1.3127 | 3400 | inf             | 0.3941 |
+| 0.5359        | 1.3900 | 3600 | inf             | 0.3819 |
+| 0.5359        | 1.4672 | 3800 | inf             | 0.3811 |
+| 0.5172        | 1.5444 | 4000 | inf             | 0.3691 |
+| 0.5172        | 1.6216 | 4200 | inf             | 0.3609 |
+| 0.5172        | 1.6988 | 4400 | inf             | 0.3600 |
+| 0.4817        | 1.7761 | 4600 | inf             | 0.3509 |
+| 0.4817        | 1.8533 | 4800 | inf             | 0.3530 |
+| 0.4818        | 1.9305 | 5000 | inf             | 0.3434 |
+| 0.4818        | 2.0077 | 5200 | inf             | 0.3363 |
+| 0.4818        | 2.0849 | 5400 | inf             | 0.3372 |
+| 0.4196        | 2.1622 | 5600 | inf             | 0.3320 |
+| 0.4196        | 2.2394 | 5800 | inf             | 0.3293 |
+| 0.3743        | 2.3166 | 6000 | inf             | 0.3264 |
 ### Framework versions
+- Transformers 4.44.0
+- Pytorch 2.4.0+cu121
+- Datasets 2.21.0
 - Tokenizers 0.19.1