End of training

Browse files

Files changed (6) hide show

README.md +3 -1
all_results.json +12 -12
eval_results.json +6 -6
runs/Aug28_18-08-25_6d77da852b30/events.out.tfevents.1724876332.6d77da852b30.328.1 +3 -0
train_results.json +7 -7
trainer_state.json +231 -231

README.md CHANGED Viewed

@@ -2,6 +2,8 @@
 license: apache-2.0
 base_model: facebook/wav2vec2-large-xlsr-53
 tags:
 - generated_from_trainer
 metrics:
 - wer
@@ -15,7 +17,7 @@ should probably proofread and complete it, then remove this comment. -->
 # wav2vec2-xlsr-53-ft-btb-ccv-cy
-This model is a fine-tuned version of [facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 1.8413
 - Wer: 0.9956

 license: apache-2.0
 base_model: facebook/wav2vec2-large-xlsr-53
 tags:
+- automatic-speech-recognition
+- DewiBrynJones/banc-trawsgrifiadau-bangor-clean-with-ccv
 - generated_from_trainer
 metrics:
 - wer
 # wav2vec2-xlsr-53-ft-btb-ccv-cy
+This model is a fine-tuned version of [facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53) on the DEWIBRYNJONES/BANC-TRAWSGRIFIADAU-BANGOR-CLEAN-WITH-CCV - DEFAULT dataset.
 It achieves the following results on the evaluation set:
 - Loss: 1.8413
 - Wer: 0.9956

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
-    "epoch": 1.8933417481855475,
-    "eval_loss": 0.7821305990219116,
-    "eval_runtime": 188.4729,
     "eval_samples": 7022,
-    "eval_samples_per_second": 37.257,
-    "eval_steps_per_second": 0.584,
-    "eval_wer": 0.45755324944524906,
-    "total_flos": 1.3297699695003722e+19,
-    "train_loss": 0.9828314208984374,
-    "train_runtime": 9865.427,
-    "train_samples": 50697,
-    "train_samples_per_second": 9.731,
-    "train_steps_per_second": 0.608
 }

 {
+    "epoch": 2.0161290322580645,
+    "eval_loss": 1.8412970304489136,
+    "eval_runtime": 190.5883,
     "eval_samples": 7022,
+    "eval_samples_per_second": 36.844,
+    "eval_steps_per_second": 0.577,
+    "eval_wer": 0.9956417172696953,
+    "total_flos": 1.3379687773166643e+19,
+    "train_loss": 1.3496905517578126,
+    "train_runtime": 9965.7858,
+    "train_samples": 47607,
+    "train_samples_per_second": 9.633,
+    "train_steps_per_second": 0.602
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 1.8933417481855475,
-    "eval_loss": 0.7821305990219116,
-    "eval_runtime": 188.4729,
     "eval_samples": 7022,
-    "eval_samples_per_second": 37.257,
-    "eval_steps_per_second": 0.584,
-    "eval_wer": 0.45755324944524906
 }

 {
+    "epoch": 2.0161290322580645,
+    "eval_loss": 1.8412970304489136,
+    "eval_runtime": 190.5883,
     "eval_samples": 7022,
+    "eval_samples_per_second": 36.844,
+    "eval_steps_per_second": 0.577,
+    "eval_wer": 0.9956417172696953
 }

runs/Aug28_18-08-25_6d77da852b30/events.out.tfevents.1724876332.6d77da852b30.328.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a8ad6dce9acd4c4a3aa1a538513f77f8416b0a6aae8f4e1952b10b80c5d798ae
+size 406

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 1.8933417481855475,
-    "total_flos": 1.3297699695003722e+19,
-    "train_loss": 0.9828314208984374,
-    "train_runtime": 9865.427,
-    "train_samples": 50697,
-    "train_samples_per_second": 9.731,
-    "train_steps_per_second": 0.608
 }

 {
+    "epoch": 2.0161290322580645,
+    "total_flos": 1.3379687773166643e+19,
+    "train_loss": 1.3496905517578126,
+    "train_runtime": 9965.7858,
+    "train_samples": 47607,
+    "train_samples_per_second": 9.633,
+    "train_steps_per_second": 0.602
 }

trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.8933417481855475,
   "eval_steps": 200,
   "global_step": 6000,
   "is_hyper_param_search": false,
@@ -9,373 +9,373 @@
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.06311139160618491,
-      "eval_loss": 3.0427980422973633,
-      "eval_runtime": 195.72,
-      "eval_samples_per_second": 35.878,
-      "eval_steps_per_second": 0.562,
       "eval_wer": 1.0,
       "step": 200
     },
     {
-      "epoch": 0.12622278321236982,
-      "eval_loss": 3.1055634021759033,
-      "eval_runtime": 193.3912,
-      "eval_samples_per_second": 36.31,
-      "eval_steps_per_second": 0.569,
       "eval_wer": 1.0,
       "step": 400
     },
     {
-      "epoch": 0.1577784790154623,
-      "grad_norm": 6.020185947418213,
       "learning_rate": 0.00024599999999999996,
-      "loss": 4.232,
       "step": 500
     },
     {
-      "epoch": 0.18933417481855475,
-      "eval_loss": 1.2093147039413452,
-      "eval_runtime": 194.3659,
-      "eval_samples_per_second": 36.128,
-      "eval_steps_per_second": 0.566,
-      "eval_wer": 0.8286185040991775,
       "step": 600
     },
     {
-      "epoch": 0.25244556642473964,
-      "eval_loss": 1.0886054039001465,
-      "eval_runtime": 194.9365,
-      "eval_samples_per_second": 36.022,
-      "eval_steps_per_second": 0.564,
-      "eval_wer": 0.7324838225328533,
       "step": 800
     },
     {
-      "epoch": 0.3155569580309246,
-      "grad_norm": 4.922729969024658,
-      "learning_rate": 0.00027822222222222224,
-      "loss": 1.0379,
       "step": 1000
     },
     {
-      "epoch": 0.3155569580309246,
-      "eval_loss": 0.9017586708068848,
-      "eval_runtime": 193.3111,
-      "eval_samples_per_second": 36.325,
-      "eval_steps_per_second": 0.569,
-      "eval_wer": 0.673049070543058,
       "step": 1000
     },
     {
-      "epoch": 0.3786683496371095,
-      "eval_loss": 0.8131064772605896,
-      "eval_runtime": 192.8235,
-      "eval_samples_per_second": 36.417,
-      "eval_steps_per_second": 0.57,
-      "eval_wer": 0.5803292629452956,
       "step": 1200
     },
     {
-      "epoch": 0.4417797412432944,
-      "eval_loss": 0.7567442655563354,
-      "eval_runtime": 192.8955,
-      "eval_samples_per_second": 36.403,
-      "eval_steps_per_second": 0.57,
-      "eval_wer": 0.5543788782736948,
       "step": 1400
     },
     {
-      "epoch": 0.47333543704638686,
-      "grad_norm": 25.353076934814453,
-      "learning_rate": 0.00025049999999999996,
-      "loss": 0.8008,
       "step": 1500
     },
     {
-      "epoch": 0.5048911328494793,
-      "eval_loss": 0.704021155834198,
-      "eval_runtime": 193.2182,
-      "eval_samples_per_second": 36.342,
-      "eval_steps_per_second": 0.569,
-      "eval_wer": 0.5137857266240583,
       "step": 1600
     },
     {
-      "epoch": 0.5680025244556642,
-      "eval_loss": 0.6949470043182373,
-      "eval_runtime": 192.7198,
-      "eval_samples_per_second": 36.436,
-      "eval_steps_per_second": 0.571,
-      "eval_wer": 0.5236450125566378,
       "step": 1800
     },
     {
-      "epoch": 0.6311139160618492,
-      "grad_norm": NaN,
-      "learning_rate": 0.00022277777777777774,
-      "loss": 0.7212,
       "step": 2000
     },
     {
-      "epoch": 0.6311139160618492,
-      "eval_loss": 0.672233521938324,
-      "eval_runtime": 194.6494,
-      "eval_samples_per_second": 36.075,
-      "eval_steps_per_second": 0.565,
-      "eval_wer": 0.4992758341195073,
       "step": 2000
     },
     {
-      "epoch": 0.694225307668034,
-      "eval_loss": 0.6403974890708923,
-      "eval_runtime": 192.2183,
-      "eval_samples_per_second": 36.531,
-      "eval_steps_per_second": 0.572,
-      "eval_wer": 0.4761689631804834,
       "step": 2200
     },
     {
-      "epoch": 0.757336699274219,
-      "eval_loss": 0.6335896849632263,
-      "eval_runtime": 192.0564,
-      "eval_samples_per_second": 36.562,
-      "eval_steps_per_second": 0.573,
-      "eval_wer": 0.4685552558497987,
       "step": 2400
     },
     {
-      "epoch": 0.7888923950773115,
-      "grad_norm": 5.390285968780518,
-      "learning_rate": 0.00019505555555555555,
-      "loss": 0.6639,
       "step": 2500
     },
     {
-      "epoch": 0.8204480908804039,
-      "eval_loss": 0.593280553817749,
-      "eval_runtime": 191.8655,
-      "eval_samples_per_second": 36.599,
-      "eval_steps_per_second": 0.573,
-      "eval_wer": 0.45866939502252224,
       "step": 2600
     },
     {
-      "epoch": 0.8835594824865888,
-      "eval_loss": 0.5996308326721191,
-      "eval_runtime": 192.1279,
-      "eval_samples_per_second": 36.549,
-      "eval_steps_per_second": 0.573,
-      "eval_wer": 0.45444398676570247,
       "step": 2800
     },
     {
-      "epoch": 0.9466708740927737,
-      "grad_norm": 7.231433391571045,
-      "learning_rate": 0.00016733333333333333,
-      "loss": 0.6278,
       "step": 3000
     },
     {
-      "epoch": 0.9466708740927737,
-      "eval_loss": 0.5639352202415466,
-      "eval_runtime": 195.2391,
-      "eval_samples_per_second": 35.966,
-      "eval_steps_per_second": 0.563,
-      "eval_wer": 0.42424161894258494,
       "step": 3000
     },
     {
-      "epoch": 1.0097822656989586,
-      "eval_loss": 0.566460371017456,
-      "eval_runtime": 191.9621,
-      "eval_samples_per_second": 36.58,
-      "eval_steps_per_second": 0.573,
-      "eval_wer": 0.4227534248395541,
       "step": 3200
     },
     {
-      "epoch": 1.0728936573051435,
-      "eval_loss": 0.5476272106170654,
-      "eval_runtime": 193.6396,
-      "eval_samples_per_second": 36.263,
-      "eval_steps_per_second": 0.568,
-      "eval_wer": 0.41909937681871934,
       "step": 3400
     },
     {
-      "epoch": 1.104449353108236,
-      "grad_norm": 4.519629955291748,
-      "learning_rate": 0.00013955555555555555,
-      "loss": 0.5528,
       "step": 3500
     },
     {
-      "epoch": 1.1360050489113285,
-      "eval_loss": 0.5440065860748291,
-      "eval_runtime": 191.7996,
-      "eval_samples_per_second": 36.611,
       "eval_steps_per_second": 0.574,
-      "eval_wer": 0.41887349021379505,
       "step": 3600
     },
     {
-      "epoch": 1.1991164405175134,
-      "eval_loss": 0.5297770500183105,
-      "eval_runtime": 191.4083,
-      "eval_samples_per_second": 36.686,
-      "eval_steps_per_second": 0.575,
-      "eval_wer": 0.4070875244156845,
       "step": 3800
     },
     {
-      "epoch": 1.2622278321236984,
-      "grad_norm": 1.4278947114944458,
-      "learning_rate": 0.00011183333333333332,
-      "loss": 0.5103,
       "step": 4000
     },
     {
-      "epoch": 1.2622278321236984,
-      "eval_loss": 0.5384453535079956,
-      "eval_runtime": 195.1408,
-      "eval_samples_per_second": 35.984,
-      "eval_steps_per_second": 0.564,
-      "eval_wer": 0.4025033550804555,
       "step": 4000
     },
     {
-      "epoch": 1.325339223729883,
-      "eval_loss": 0.531086266040802,
-      "eval_runtime": 192.0473,
-      "eval_samples_per_second": 36.564,
-      "eval_steps_per_second": 0.573,
-      "eval_wer": 0.39976614092666657,
       "step": 4200
     },
     {
-      "epoch": 1.388450615336068,
-      "eval_loss": 0.5395579934120178,
-      "eval_runtime": 191.3816,
-      "eval_samples_per_second": 36.691,
-      "eval_steps_per_second": 0.575,
-      "eval_wer": 0.4039383993940924,
       "step": 4400
     },
     {
-      "epoch": 1.4200063111391605,
-      "grad_norm": 2.4821906089782715,
-      "learning_rate": 8.411111111111111e-05,
-      "loss": 0.5194,
       "step": 4500
     },
     {
-      "epoch": 1.451562006942253,
-      "eval_loss": 0.5501742959022522,
-      "eval_runtime": 190.6511,
-      "eval_samples_per_second": 36.832,
       "eval_steps_per_second": 0.577,
-      "eval_wer": 0.4048818081558352,
       "step": 4600
     },
     {
-      "epoch": 1.514673398548438,
-      "eval_loss": 0.6632032990455627,
-      "eval_runtime": 193.4271,
-      "eval_samples_per_second": 36.303,
-      "eval_steps_per_second": 0.569,
-      "eval_wer": 0.4365059328452411,
       "step": 4800
     },
     {
-      "epoch": 1.577784790154623,
-      "grad_norm": 11.192009925842285,
-      "learning_rate": 5.649999999999999e-05,
-      "loss": 0.6034,
       "step": 5000
     },
     {
-      "epoch": 1.577784790154623,
-      "eval_loss": 0.7074605226516724,
-      "eval_runtime": 191.8555,
-      "eval_samples_per_second": 36.6,
-      "eval_steps_per_second": 0.573,
-      "eval_wer": 0.4368115441342564,
       "step": 5000
     },
     {
-      "epoch": 1.6408961817608079,
-      "eval_loss": 0.7465850710868835,
-      "eval_runtime": 191.8575,
-      "eval_samples_per_second": 36.6,
-      "eval_steps_per_second": 0.573,
-      "eval_wer": 0.44187406157403103,
       "step": 5200
     },
     {
-      "epoch": 1.7040075733669928,
-      "eval_loss": 0.7624653577804565,
-      "eval_runtime": 189.4967,
-      "eval_samples_per_second": 37.056,
-      "eval_steps_per_second": 0.58,
-      "eval_wer": 0.449819955088428,
       "step": 5400
     },
     {
-      "epoch": 1.7355632691700853,
-      "grad_norm": 17.51552963256836,
       "learning_rate": 2.8777777777777776e-05,
-      "loss": 0.74,
       "step": 5500
     },
     {
-      "epoch": 1.7671189649731778,
-      "eval_loss": 0.7502115368843079,
-      "eval_runtime": 192.6564,
-      "eval_samples_per_second": 36.448,
-      "eval_steps_per_second": 0.571,
-      "eval_wer": 0.4474813643550937,
       "step": 5600
     },
     {
-      "epoch": 1.8302303565793627,
-      "eval_loss": 0.7739897966384888,
-      "eval_runtime": 189.3036,
-      "eval_samples_per_second": 37.094,
-      "eval_steps_per_second": 0.581,
-      "eval_wer": 0.45959951633691654,
       "step": 5800
     },
     {
-      "epoch": 1.8933417481855475,
-      "grad_norm": 10.696316719055176,
-      "learning_rate": 1e-06,
-      "loss": 0.7844,
       "step": 6000
     },
     {
-      "epoch": 1.8933417481855475,
-      "eval_loss": 0.7821305990219116,
-      "eval_runtime": 189.7595,
-      "eval_samples_per_second": 37.005,
-      "eval_steps_per_second": 0.58,
-      "eval_wer": 0.45755324944524906,
       "step": 6000
     },
     {
-      "epoch": 1.8933417481855475,
       "step": 6000,
-      "total_flos": 1.3297699695003722e+19,
-      "train_loss": 0.9828314208984374,
-      "train_runtime": 9865.427,
-      "train_samples_per_second": 9.731,
-      "train_steps_per_second": 0.608
     }
   ],
   "logging_steps": 500,
   "max_steps": 6000,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 2,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -389,7 +389,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.3297699695003722e+19,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 2.0161290322580645,
   "eval_steps": 200,
   "global_step": 6000,
   "is_hyper_param_search": false,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.06720430107526881,
+      "eval_loss": 3.080493211746216,
+      "eval_runtime": 198.5178,
+      "eval_samples_per_second": 35.372,
+      "eval_steps_per_second": 0.554,
       "eval_wer": 1.0,
       "step": 200
     },
     {
+      "epoch": 0.13440860215053763,
+      "eval_loss": 2.92264461517334,
+      "eval_runtime": 201.3326,
+      "eval_samples_per_second": 34.878,
+      "eval_steps_per_second": 0.546,
       "eval_wer": 1.0,
       "step": 400
     },
     {
+      "epoch": 0.16801075268817203,
+      "grad_norm": 5.131893634796143,
       "learning_rate": 0.00024599999999999996,
+      "loss": 4.4646,
       "step": 500
     },
     {
+      "epoch": 0.20161290322580644,
+      "eval_loss": 1.3392444849014282,
+      "eval_runtime": 198.1589,
+      "eval_samples_per_second": 35.436,
+      "eval_steps_per_second": 0.555,
+      "eval_wer": 0.8646141989662366,
       "step": 600
     },
     {
+      "epoch": 0.26881720430107525,
+      "eval_loss": 1.0115001201629639,
+      "eval_runtime": 200.6717,
+      "eval_samples_per_second": 34.992,
+      "eval_steps_per_second": 0.548,
+      "eval_wer": 0.7168179221089837,
       "step": 800
     },
     {
+      "epoch": 0.33602150537634407,
+      "grad_norm": 6.313941478729248,
+      "learning_rate": 0.0002782777777777778,
+      "loss": 1.1042,
       "step": 1000
     },
     {
+      "epoch": 0.33602150537634407,
+      "eval_loss": 0.9008844494819641,
+      "eval_runtime": 199.6418,
+      "eval_samples_per_second": 35.173,
+      "eval_steps_per_second": 0.551,
+      "eval_wer": 0.6766765436691957,
       "step": 1000
     },
     {
+      "epoch": 0.4032258064516129,
+      "eval_loss": 0.8225907683372498,
+      "eval_runtime": 199.7483,
+      "eval_samples_per_second": 35.154,
+      "eval_steps_per_second": 0.551,
+      "eval_wer": 0.5947727182131041,
       "step": 1200
     },
     {
+      "epoch": 0.47043010752688175,
+      "eval_loss": 0.8068214058876038,
+      "eval_runtime": 197.9234,
+      "eval_samples_per_second": 35.478,
+      "eval_steps_per_second": 0.556,
+      "eval_wer": 0.5977358189718174,
       "step": 1400
     },
     {
+      "epoch": 0.5040322580645161,
+      "grad_norm": 8.026273727416992,
+      "learning_rate": 0.0002505555555555555,
+      "loss": 0.8421,
       "step": 1500
     },
     {
+      "epoch": 0.5376344086021505,
+      "eval_loss": 0.7186344861984253,
+      "eval_runtime": 197.8905,
+      "eval_samples_per_second": 35.484,
+      "eval_steps_per_second": 0.556,
+      "eval_wer": 0.5375171075884612,
       "step": 1600
     },
     {
+      "epoch": 0.6048387096774194,
+      "eval_loss": 0.7200700640678406,
+      "eval_runtime": 197.0513,
+      "eval_samples_per_second": 35.635,
+      "eval_steps_per_second": 0.558,
+      "eval_wer": 0.5560796715343016,
       "step": 1800
     },
     {
+      "epoch": 0.6720430107526881,
+      "grad_norm": 4.496196746826172,
+      "learning_rate": 0.00022283333333333332,
+      "loss": 0.7637,
       "step": 2000
     },
     {
+      "epoch": 0.6720430107526881,
+      "eval_loss": 0.6747044920921326,
+      "eval_runtime": 198.0259,
+      "eval_samples_per_second": 35.46,
+      "eval_steps_per_second": 0.555,
+      "eval_wer": 0.5086966342895867,
       "step": 2000
     },
     {
+      "epoch": 0.739247311827957,
+      "eval_loss": 0.6709386706352234,
+      "eval_runtime": 199.0402,
+      "eval_samples_per_second": 35.279,
+      "eval_steps_per_second": 0.553,
+      "eval_wer": 0.5050558737161004,
       "step": 2200
     },
     {
+      "epoch": 0.8064516129032258,
+      "eval_loss": 0.6484177708625793,
+      "eval_runtime": 193.7002,
+      "eval_samples_per_second": 36.252,
+      "eval_steps_per_second": 0.568,
+      "eval_wer": 0.48504497800927465,
       "step": 2400
     },
     {
+      "epoch": 0.8400537634408602,
+      "grad_norm": 4.925416469573975,
+      "learning_rate": 0.00019516666666666665,
+      "loss": 0.7134,
       "step": 2500
     },
     {
+      "epoch": 0.8736559139784946,
+      "eval_loss": 0.6387702226638794,
+      "eval_runtime": 191.5475,
+      "eval_samples_per_second": 36.659,
+      "eval_steps_per_second": 0.574,
+      "eval_wer": 0.4915159648679892,
       "step": 2600
     },
     {
+      "epoch": 0.9408602150537635,
+      "eval_loss": 0.627938985824585,
+      "eval_runtime": 192.2841,
+      "eval_samples_per_second": 36.519,
+      "eval_steps_per_second": 0.572,
+      "eval_wer": 0.4705217980573752,
       "step": 2800
     },
     {
+      "epoch": 1.0080645161290323,
+      "grad_norm": 2.991081714630127,
+      "learning_rate": 0.00016738888888888888,
+      "loss": 0.6968,
       "step": 3000
     },
     {
+      "epoch": 1.0080645161290323,
+      "eval_loss": 0.6451985836029053,
+      "eval_runtime": 192.2109,
+      "eval_samples_per_second": 36.533,
+      "eval_steps_per_second": 0.572,
+      "eval_wer": 0.4833441847486679,
       "step": 3000
     },
     {
+      "epoch": 1.075268817204301,
+      "eval_loss": 0.6439228057861328,
+      "eval_runtime": 191.7283,
+      "eval_samples_per_second": 36.625,
+      "eval_steps_per_second": 0.574,
+      "eval_wer": 0.4896955845812461,
       "step": 3200
     },
     {
+      "epoch": 1.14247311827957,
+      "eval_loss": 0.6749800443649292,
+      "eval_runtime": 191.0444,
+      "eval_samples_per_second": 36.756,
+      "eval_steps_per_second": 0.576,
+      "eval_wer": 0.5010164897221595,
       "step": 3400
     },
     {
+      "epoch": 1.1760752688172043,
+      "grad_norm": 17.283771514892578,
+      "learning_rate": 0.00013977777777777776,
+      "loss": 0.667,
       "step": 3500
     },
     {
+      "epoch": 1.2096774193548387,
+      "eval_loss": 0.7904173135757446,
+      "eval_runtime": 191.7132,
+      "eval_samples_per_second": 36.628,
       "eval_steps_per_second": 0.574,
+      "eval_wer": 0.5591756467664997,
       "step": 3600
     },
     {
+      "epoch": 1.2768817204301075,
+      "eval_loss": 0.9479840993881226,
+      "eval_runtime": 192.8834,
+      "eval_samples_per_second": 36.405,
+      "eval_steps_per_second": 0.57,
+      "eval_wer": 0.5800502265509773,
       "step": 3800
     },
     {
+      "epoch": 1.3440860215053765,
+      "grad_norm": 26.34053611755371,
+      "learning_rate": 0.0001121111111111111,
+      "loss": 0.9326,
       "step": 4000
     },
     {
+      "epoch": 1.3440860215053765,
+      "eval_loss": 1.1457170248031616,
+      "eval_runtime": 189.9612,
+      "eval_samples_per_second": 36.965,
+      "eval_steps_per_second": 0.579,
+      "eval_wer": 0.6581804169600978,
       "step": 4000
     },
     {
+      "epoch": 1.4112903225806452,
+      "eval_loss": 1.118348479270935,
+      "eval_runtime": 190.0092,
+      "eval_samples_per_second": 36.956,
+      "eval_steps_per_second": 0.579,
+      "eval_wer": 0.6742183659097251,
       "step": 4200
     },
     {
+      "epoch": 1.478494623655914,
+      "eval_loss": 1.3061094284057617,
+      "eval_runtime": 190.4579,
+      "eval_samples_per_second": 36.869,
+      "eval_steps_per_second": 0.578,
+      "eval_wer": 0.78073054385522,
       "step": 4400
     },
     {
+      "epoch": 1.5120967741935485,
+      "grad_norm": 15.129014015197754,
+      "learning_rate": 8.433333333333331e-05,
+      "loss": 1.2308,
       "step": 4500
     },
     {
+      "epoch": 1.5456989247311828,
+      "eval_loss": 1.2298626899719238,
+      "eval_runtime": 190.6991,
+      "eval_samples_per_second": 36.822,
       "eval_steps_per_second": 0.577,
+      "eval_wer": 0.7672304973491543,
       "step": 4600
     },
     {
+      "epoch": 1.6129032258064515,
+      "eval_loss": 1.178423523902893,
+      "eval_runtime": 190.1804,
+      "eval_samples_per_second": 36.923,
+      "eval_steps_per_second": 0.578,
+      "eval_wer": 0.7516974713987696,
       "step": 4800
     },
     {
+      "epoch": 1.6801075268817205,
+      "grad_norm": 3.6261146068573,
+      "learning_rate": 5.6555555555555555e-05,
+      "loss": 1.2835,
       "step": 5000
     },
     {
+      "epoch": 1.6801075268817205,
+      "eval_loss": 1.339849829673767,
+      "eval_runtime": 189.6315,
+      "eval_samples_per_second": 37.03,
+      "eval_steps_per_second": 0.58,
+      "eval_wer": 0.7625267409877888,
       "step": 5000
     },
     {
+      "epoch": 1.7473118279569892,
+      "eval_loss": 1.5754368305206299,
+      "eval_runtime": 190.0111,
+      "eval_samples_per_second": 36.956,
+      "eval_steps_per_second": 0.579,
+      "eval_wer": 0.895573951288218,
       "step": 5200
     },
     {
+      "epoch": 1.814516129032258,
+      "eval_loss": 1.728023886680603,
+      "eval_runtime": 190.3066,
+      "eval_samples_per_second": 36.898,
+      "eval_steps_per_second": 0.578,
+      "eval_wer": 0.9705550166757464,
       "step": 5400
     },
     {
+      "epoch": 1.8481182795698925,
+      "grad_norm": 4.430452346801758,
       "learning_rate": 2.8777777777777776e-05,
+      "loss": 1.6466,
       "step": 5500
     },
     {
+      "epoch": 1.881720430107527,
+      "eval_loss": 1.7603241205215454,
+      "eval_runtime": 190.0315,
+      "eval_samples_per_second": 36.952,
+      "eval_steps_per_second": 0.579,
+      "eval_wer": 0.9727208705935503,
       "step": 5600
     },
     {
+      "epoch": 1.9489247311827957,
+      "eval_loss": 1.8200371265411377,
+      "eval_runtime": 190.0189,
+      "eval_samples_per_second": 36.954,
+      "eval_steps_per_second": 0.579,
+      "eval_wer": 0.9943661223242403,
       "step": 5800
     },
     {
+      "epoch": 2.0161290322580645,
+      "grad_norm": 8.303234100341797,
+      "learning_rate": 1.0555555555555555e-06,
+      "loss": 1.8511,
       "step": 6000
     },
     {
+      "epoch": 2.0161290322580645,
+      "eval_loss": 1.8412970304489136,
+      "eval_runtime": 189.9189,
+      "eval_samples_per_second": 36.974,
+      "eval_steps_per_second": 0.579,
+      "eval_wer": 0.9956417172696953,
       "step": 6000
     },
     {
+      "epoch": 2.0161290322580645,
       "step": 6000,
+      "total_flos": 1.3379687773166643e+19,
+      "train_loss": 1.3496905517578126,
+      "train_runtime": 9965.7858,
+      "train_samples_per_second": 9.633,
+      "train_steps_per_second": 0.602
     }
   ],
   "logging_steps": 500,
   "max_steps": 6000,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 1.3379687773166643e+19,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null