End of training

Browse files

Files changed (6) hide show

README.md +3 -1
all_results.json +15 -0
eval_results.json +9 -0
runs/Aug30_13-40-20_ebde17386124/events.out.tfevents.1725026022.ebde17386124.615.1 +3 -0
train_results.json +9 -0
trainer_state.json +110 -0

README.md CHANGED Viewed

@@ -2,6 +2,8 @@
 license: apache-2.0
 base_model: DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy
 tags:
 - generated_from_trainer
 metrics:
 - wer
@@ -15,7 +17,7 @@ should probably proofread and complete it, then remove this comment. -->
 # wav2vec2-btb-ccv-ft-btb-cy
-This model is a fine-tuned version of [DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy](https://huggingface.co/DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.6272
 - Wer: 0.3870

 license: apache-2.0
 base_model: DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy
 tags:
+- automatic-speech-recognition
+- DewiBrynJones/banc-trawsgrifiadau-bangor-clean
 - generated_from_trainer
 metrics:
 - wer
 # wav2vec2-btb-ccv-ft-btb-cy
+This model is a fine-tuned version of [DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy](https://huggingface.co/DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy) on the DEWIBRYNJONES/BANC-TRAWSGRIFIADAU-BANGOR-CLEAN - DEFAULT dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.6272
 - Wer: 0.3870

all_results.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+    "epoch": 2.733485193621868,
+    "eval_loss": 0.6271677017211914,
+    "eval_runtime": 201.7712,
+    "eval_samples": 7022,
+    "eval_samples_per_second": 34.802,
+    "eval_steps_per_second": 0.545,
+    "eval_wer": 0.38699690402476783,
+    "total_flos": 9.105570625839254e+18,
+    "train_loss": 1.0454113133748373,
+    "train_runtime": 3514.2413,
+    "train_samples": 28086,
+    "train_samples_per_second": 21.854,
+    "train_steps_per_second": 0.341
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 2.733485193621868,
+    "eval_loss": 0.6271677017211914,
+    "eval_runtime": 201.7712,
+    "eval_samples": 7022,
+    "eval_samples_per_second": 34.802,
+    "eval_steps_per_second": 0.545,
+    "eval_wer": 0.38699690402476783
+}

runs/Aug30_13-40-20_ebde17386124/events.out.tfevents.1725026022.ebde17386124.615.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c03b1c88d5004685e7666a7ccb995c60995eeccf892b2985bc097e19eb3c867
+size 406

train_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 2.733485193621868,
+    "total_flos": 9.105570625839254e+18,
+    "train_loss": 1.0454113133748373,
+    "train_runtime": 3514.2413,
+    "train_samples": 28086,
+    "train_samples_per_second": 21.854,
+    "train_steps_per_second": 0.341
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,110 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 2.733485193621868,
+  "eval_steps": 200,
+  "global_step": 1200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.45558086560364464,
+      "eval_loss": 0.6622544527053833,
+      "eval_runtime": 198.7007,
+      "eval_samples_per_second": 35.34,
+      "eval_steps_per_second": 0.554,
+      "eval_wer": 0.49498398862594506,
+      "step": 200
+    },
+    {
+      "epoch": 0.9111617312072893,
+      "eval_loss": 0.5531215667724609,
+      "eval_runtime": 198.3629,
+      "eval_samples_per_second": 35.4,
+      "eval_steps_per_second": 0.555,
+      "eval_wer": 0.41153881927742864,
+      "step": 400
+    },
+    {
+      "epoch": 1.1389521640091116,
+      "grad_norm": 0.38089731335639954,
+      "learning_rate": 0.0001969444444444444,
+      "loss": 1.5958,
+      "step": 500
+    },
+    {
+      "epoch": 1.366742596810934,
+      "eval_loss": 0.5106531381607056,
+      "eval_runtime": 200.3157,
+      "eval_samples_per_second": 35.055,
+      "eval_steps_per_second": 0.549,
+      "eval_wer": 0.38682416720923746,
+      "step": 600
+    },
+    {
+      "epoch": 1.8223234624145785,
+      "eval_loss": 0.5462459325790405,
+      "eval_runtime": 199.4037,
+      "eval_samples_per_second": 35.215,
+      "eval_steps_per_second": 0.552,
+      "eval_wer": 0.399859153058106,
+      "step": 800
+    },
+    {
+      "epoch": 2.277904328018223,
+      "grad_norm": 2.8862736225128174,
+      "learning_rate": 5.972222222222221e-05,
+      "loss": 0.6374,
+      "step": 1000
+    },
+    {
+      "epoch": 2.277904328018223,
+      "eval_loss": 0.5843283534049988,
+      "eval_runtime": 200.2605,
+      "eval_samples_per_second": 35.064,
+      "eval_steps_per_second": 0.549,
+      "eval_wer": 0.38792702533916207,
+      "step": 1000
+    },
+    {
+      "epoch": 2.733485193621868,
+      "eval_loss": 0.6271677017211914,
+      "eval_runtime": 200.7317,
+      "eval_samples_per_second": 34.982,
+      "eval_steps_per_second": 0.548,
+      "eval_wer": 0.38699690402476783,
+      "step": 1200
+    },
+    {
+      "epoch": 2.733485193621868,
+      "step": 1200,
+      "total_flos": 9.105570625839254e+18,
+      "train_loss": 1.0454113133748373,
+      "train_runtime": 3514.2413,
+      "train_samples_per_second": 21.854,
+      "train_steps_per_second": 0.341
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 1200,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 9.105570625839254e+18,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": null
+}