alinerodrigues
/

wav2vec2-xlsr-1b-mecita-portuguese-all-text-protecao_aos_pandas-os_morcegos

+{
+    "epoch": 32.0,
+    "eval_cer": 0.033413205537806176,
+    "eval_loss": 0.21965597569942474,
+    "eval_runtime": 5.3256,
+    "eval_samples": 86,
+    "eval_samples_per_second": 16.148,
+    "eval_steps_per_second": 2.065,
+    "eval_wer": 0.09813084112149532,
+    "total_flos": 1.751552315123992e+19,
+    "train_loss": 0.6797193247218465,
+    "train_runtime": 4402.1651,
+    "train_samples": 683,
+    "train_samples_per_second": 15.515,
+    "train_steps_per_second": 0.477
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "epoch": 32.0,
+    "eval_cer": 0.033413205537806176,
+    "eval_loss": 0.21965597569942474,
+    "eval_runtime": 5.3256,
+    "eval_samples": 86,
+    "eval_samples_per_second": 16.148,
+    "eval_steps_per_second": 2.065,
+    "eval_wer": 0.09813084112149532
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 32.0,
+    "total_flos": 1.751552315123992e+19,
+    "train_loss": 0.6797193247218465,
+    "train_runtime": 4402.1651,
+    "train_samples": 683,
+    "train_samples_per_second": 15.515,
+    "train_steps_per_second": 0.477
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,387 @@

+{
+  "best_metric": 0.21965597569942474,
+  "best_model_checkpoint": "wav2vec2-xlsr-1b-mecita-portuguese-all-text-protecao_aos_pandas-os_morcegos/checkpoint-258",
+  "epoch": 32.0,
+  "global_step": 688,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 2.9985714285714284e-05,
+      "loss": 13.2168,
+      "step": 1
+    },
+    {
+      "epoch": 0.98,
+      "eval_cer": 1.0,
+      "eval_loss": 2.912194013595581,
+      "eval_runtime": 5.4283,
+      "eval_samples_per_second": 15.843,
+      "eval_steps_per_second": 2.026,
+      "eval_wer": 1.0,
+      "step": 21
+    },
+    {
+      "epoch": 2.0,
+      "eval_cer": 1.0,
+      "eval_loss": 2.9751322269439697,
+      "eval_runtime": 5.3304,
+      "eval_samples_per_second": 16.134,
+      "eval_steps_per_second": 2.064,
+      "eval_wer": 1.0,
+      "step": 43
+    },
+    {
+      "epoch": 2.98,
+      "eval_cer": 1.0,
+      "eval_loss": 2.8292453289031982,
+      "eval_runtime": 5.3441,
+      "eval_samples_per_second": 16.092,
+      "eval_steps_per_second": 2.058,
+      "eval_wer": 1.0,
+      "step": 64
+    },
+    {
+      "epoch": 4.0,
+      "eval_cer": 0.999866879659212,
+      "eval_loss": 2.587308406829834,
+      "eval_runtime": 5.3309,
+      "eval_samples_per_second": 16.132,
+      "eval_steps_per_second": 2.063,
+      "eval_wer": 0.9992211838006231,
+      "step": 86
+    },
+    {
+      "epoch": 4.65,
+      "learning_rate": 2.86e-05,
+      "loss": 3.3173,
+      "step": 100
+    },
+    {
+      "epoch": 4.98,
+      "eval_cer": 0.23575612353567624,
+      "eval_loss": 1.0785298347473145,
+      "eval_runtime": 5.4048,
+      "eval_samples_per_second": 15.912,
+      "eval_steps_per_second": 2.035,
+      "eval_wer": 0.8940809968847352,
+      "step": 107
+    },
+    {
+      "epoch": 6.0,
+      "eval_cer": 0.06110223642172524,
+      "eval_loss": 0.3221881687641144,
+      "eval_runtime": 5.3075,
+      "eval_samples_per_second": 16.204,
+      "eval_steps_per_second": 2.073,
+      "eval_wer": 0.23052959501557632,
+      "step": 129
+    },
+    {
+      "epoch": 6.98,
+      "eval_cer": 0.0424653887113951,
+      "eval_loss": 0.2690502405166626,
+      "eval_runtime": 5.3502,
+      "eval_samples_per_second": 16.074,
+      "eval_steps_per_second": 2.056,
+      "eval_wer": 0.13629283489096572,
+      "step": 150
+    },
+    {
+      "epoch": 8.0,
+      "eval_cer": 0.03727369542066028,
+      "eval_loss": 0.23176124691963196,
+      "eval_runtime": 5.3567,
+      "eval_samples_per_second": 16.055,
+      "eval_steps_per_second": 2.053,
+      "eval_wer": 0.11682242990654206,
+      "step": 172
+    },
+    {
+      "epoch": 8.98,
+      "eval_cer": 0.03394568690095846,
+      "eval_loss": 0.22206291556358337,
+      "eval_runtime": 5.3897,
+      "eval_samples_per_second": 15.956,
+      "eval_steps_per_second": 2.041,
+      "eval_wer": 0.09657320872274143,
+      "step": 193
+    },
+    {
+      "epoch": 9.3,
+      "learning_rate": 2.717142857142857e-05,
+      "loss": 0.5524,
+      "step": 200
+    },
+    {
+      "epoch": 10.0,
+      "eval_cer": 0.03487752928647497,
+      "eval_loss": 0.22993727028369904,
+      "eval_runtime": 5.3145,
+      "eval_samples_per_second": 16.182,
+      "eval_steps_per_second": 2.07,
+      "eval_wer": 0.102803738317757,
+      "step": 215
+    },
+    {
+      "epoch": 10.98,
+      "eval_cer": 0.03221512247071352,
+      "eval_loss": 0.22247014939785004,
+      "eval_runtime": 5.3965,
+      "eval_samples_per_second": 15.936,
+      "eval_steps_per_second": 2.038,
+      "eval_wer": 0.0911214953271028,
+      "step": 236
+    },
+    {
+      "epoch": 12.0,
+      "eval_cer": 0.033413205537806176,
+      "eval_loss": 0.21965597569942474,
+      "eval_runtime": 5.3359,
+      "eval_samples_per_second": 16.117,
+      "eval_steps_per_second": 2.062,
+      "eval_wer": 0.09813084112149532,
+      "step": 258
+    },
+    {
+      "epoch": 12.98,
+      "eval_cer": 0.032348242811501594,
+      "eval_loss": 0.2268439382314682,
+      "eval_runtime": 5.3114,
+      "eval_samples_per_second": 16.192,
+      "eval_steps_per_second": 2.071,
+      "eval_wer": 0.09190031152647975,
+      "step": 279
+    },
+    {
+      "epoch": 13.95,
+      "learning_rate": 2.5742857142857144e-05,
+      "loss": 0.2169,
+      "step": 300
+    },
+    {
+      "epoch": 14.0,
+      "eval_cer": 0.03301384451544196,
+      "eval_loss": 0.2250145524740219,
+      "eval_runtime": 5.3082,
+      "eval_samples_per_second": 16.201,
+      "eval_steps_per_second": 2.072,
+      "eval_wer": 0.09657320872274143,
+      "step": 301
+    },
+    {
+      "epoch": 14.98,
+      "eval_cer": 0.03367944621938232,
+      "eval_loss": 0.23428502678871155,
+      "eval_runtime": 5.3401,
+      "eval_samples_per_second": 16.105,
+      "eval_steps_per_second": 2.06,
+      "eval_wer": 0.09501557632398754,
+      "step": 322
+    },
+    {
+      "epoch": 16.0,
+      "eval_cer": 0.03288072417465389,
+      "eval_loss": 0.23504719138145447,
+      "eval_runtime": 5.3189,
+      "eval_samples_per_second": 16.169,
+      "eval_steps_per_second": 2.068,
+      "eval_wer": 0.09423676012461059,
+      "step": 344
+    },
+    {
+      "epoch": 16.98,
+      "eval_cer": 0.03194888178913738,
+      "eval_loss": 0.22562479972839355,
+      "eval_runtime": 5.2996,
+      "eval_samples_per_second": 16.228,
+      "eval_steps_per_second": 2.076,
+      "eval_wer": 0.09190031152647975,
+      "step": 365
+    },
+    {
+      "epoch": 18.0,
+      "eval_cer": 0.03075079872204473,
+      "eval_loss": 0.23361057043075562,
+      "eval_runtime": 5.3339,
+      "eval_samples_per_second": 16.123,
+      "eval_steps_per_second": 2.062,
+      "eval_wer": 0.08021806853582554,
+      "step": 387
+    },
+    {
+      "epoch": 18.6,
+      "learning_rate": 2.4314285714285714e-05,
+      "loss": 0.1634,
+      "step": 400
+    },
+    {
+      "epoch": 18.98,
+      "eval_cer": 0.030617678381256657,
+      "eval_loss": 0.2233453392982483,
+      "eval_runtime": 5.3405,
+      "eval_samples_per_second": 16.103,
+      "eval_steps_per_second": 2.06,
+      "eval_wer": 0.08255451713395638,
+      "step": 408
+    },
+    {
+      "epoch": 20.0,
+      "eval_cer": 0.030617678381256657,
+      "eval_loss": 0.23442576825618744,
+      "eval_runtime": 5.3434,
+      "eval_samples_per_second": 16.095,
+      "eval_steps_per_second": 2.059,
+      "eval_wer": 0.08255451713395638,
+      "step": 430
+    },
+    {
+      "epoch": 20.98,
+      "eval_cer": 0.030085197018104366,
+      "eval_loss": 0.2269764393568039,
+      "eval_runtime": 5.3287,
+      "eval_samples_per_second": 16.139,
+      "eval_steps_per_second": 2.064,
+      "eval_wer": 0.08177570093457943,
+      "step": 451
+    },
+    {
+      "epoch": 22.0,
+      "eval_cer": 0.030484558040468585,
+      "eval_loss": 0.22603558003902435,
+      "eval_runtime": 5.3048,
+      "eval_samples_per_second": 16.212,
+      "eval_steps_per_second": 2.074,
+      "eval_wer": 0.08566978193146417,
+      "step": 473
+    },
+    {
+      "epoch": 22.98,
+      "eval_cer": 0.030484558040468585,
+      "eval_loss": 0.24596618115901947,
+      "eval_runtime": 5.2757,
+      "eval_samples_per_second": 16.301,
+      "eval_steps_per_second": 2.085,
+      "eval_wer": 0.08411214953271028,
+      "step": 494
+    },
+    {
+      "epoch": 23.26,
+      "learning_rate": 2.2885714285714288e-05,
+      "loss": 0.1322,
+      "step": 500
+    },
+    {
+      "epoch": 24.0,
+      "eval_cer": 0.02915335463258786,
+      "eval_loss": 0.23429615795612335,
+      "eval_runtime": 5.2974,
+      "eval_samples_per_second": 16.234,
+      "eval_steps_per_second": 2.076,
+      "eval_wer": 0.07476635514018691,
+      "step": 516
+    },
+    {
+      "epoch": 24.98,
+      "eval_cer": 0.02968583599574015,
+      "eval_loss": 0.24553684890270233,
+      "eval_runtime": 5.3041,
+      "eval_samples_per_second": 16.214,
+      "eval_steps_per_second": 2.074,
+      "eval_wer": 0.0794392523364486,
+      "step": 537
+    },
+    {
+      "epoch": 26.0,
+      "eval_cer": 0.029286474973375932,
+      "eval_loss": 0.24292151629924774,
+      "eval_runtime": 5.2915,
+      "eval_samples_per_second": 16.252,
+      "eval_steps_per_second": 2.079,
+      "eval_wer": 0.07866043613707165,
+      "step": 559
+    },
+    {
+      "epoch": 26.98,
+      "eval_cer": 0.03035143769968051,
+      "eval_loss": 0.23371268808841705,
+      "eval_runtime": 5.3835,
+      "eval_samples_per_second": 15.975,
+      "eval_steps_per_second": 2.043,
+      "eval_wer": 0.08099688473520249,
+      "step": 580
+    },
+    {
+      "epoch": 27.91,
+      "learning_rate": 2.1457142857142858e-05,
+      "loss": 0.1123,
+      "step": 600
+    },
+    {
+      "epoch": 28.0,
+      "eval_cer": 0.029552715654952075,
+      "eval_loss": 0.24279381334781647,
+      "eval_runtime": 5.2948,
+      "eval_samples_per_second": 16.242,
+      "eval_steps_per_second": 2.077,
+      "eval_wer": 0.0794392523364486,
+      "step": 602
+    },
+    {
+      "epoch": 28.98,
+      "eval_cer": 0.029419595314164004,
+      "eval_loss": 0.2420278638601303,
+      "eval_runtime": 5.3074,
+      "eval_samples_per_second": 16.204,
+      "eval_steps_per_second": 2.073,
+      "eval_wer": 0.07554517133956386,
+      "step": 623
+    },
+    {
+      "epoch": 30.0,
+      "eval_cer": 0.02915335463258786,
+      "eval_loss": 0.24469688534736633,
+      "eval_runtime": 5.3053,
+      "eval_samples_per_second": 16.21,
+      "eval_steps_per_second": 2.073,
+      "eval_wer": 0.07866043613707165,
+      "step": 645
+    },
+    {
+      "epoch": 30.98,
+      "eval_cer": 0.02875399361022364,
+      "eval_loss": 0.249618262052536,
+      "eval_runtime": 5.316,
+      "eval_samples_per_second": 16.178,
+      "eval_steps_per_second": 2.069,
+      "eval_wer": 0.0763239875389408,
+      "step": 666
+    },
+    {
+      "epoch": 32.0,
+      "eval_cer": 0.029020234291799788,
+      "eval_loss": 0.2536907494068146,
+      "eval_runtime": 5.3669,
+      "eval_samples_per_second": 16.024,
+      "eval_steps_per_second": 2.05,
+      "eval_wer": 0.07866043613707165,
+      "step": 688
+    },
+    {
+      "epoch": 32.0,
+      "step": 688,
+      "total_flos": 1.751552315123992e+19,
+      "train_loss": 0.6797193247218465,
+      "train_runtime": 4402.1651,
+      "train_samples_per_second": 15.515,
+      "train_steps_per_second": 0.477
+    }
+  ],
+  "max_steps": 2100,
+  "num_train_epochs": 100,
+  "total_flos": 1.751552315123992e+19,
+  "trial_name": null,
+  "trial_params": null
+}