{ "best_metric": 0.6141512209473374, "best_model_checkpoint": "wav2vec2-base-ks-padpt800/checkpoint-50", "epoch": 10.0, "global_step": 500, "is_hyper_param_search": false, "is_local_process_zero": true, "is_world_process_zero": true, "log_history": [ { "epoch": 0.2, "learning_rate": 0.0006000000000000001, "loss": 2.3289, "step": 10 }, { "epoch": 0.4, "learning_rate": 0.0012000000000000001, "loss": 1.6644, "step": 20 }, { "epoch": 0.6, "learning_rate": 0.0018, "loss": 1.6194, "step": 30 }, { "epoch": 0.8, "learning_rate": 0.0024000000000000002, "loss": 1.4608, "step": 40 }, { "epoch": 1.0, "learning_rate": 0.003, "loss": 1.328, "step": 50 }, { "epoch": 1.0, "eval_accuracy": 0.6141512209473374, "eval_loss": 1.5281033515930176, "eval_runtime": 21.6757, "eval_samples_per_second": 313.624, "eval_steps_per_second": 1.246, "step": 50 }, { "epoch": 1.2, "learning_rate": 0.0029333333333333334, "loss": 1.1974, "step": 60 }, { "epoch": 1.4, "learning_rate": 0.0028666666666666667, "loss": 1.1006, "step": 70 }, { "epoch": 1.6, "learning_rate": 0.0028, "loss": 1.0265, "step": 80 }, { "epoch": 1.8, "learning_rate": 0.0027333333333333333, "loss": 0.9596, "step": 90 }, { "epoch": 2.0, "learning_rate": 0.0026666666666666666, "loss": 0.9328, "step": 100 }, { "epoch": 2.0, "eval_accuracy": 0.5853192115328038, "eval_loss": 1.3054088354110718, "eval_runtime": 21.7511, "eval_samples_per_second": 312.536, "eval_steps_per_second": 1.241, "step": 100 }, { "epoch": 2.2, "learning_rate": 0.0026000000000000003, "loss": 0.8865, "step": 110 }, { "epoch": 2.4, "learning_rate": 0.002533333333333333, "loss": 0.8568, "step": 120 }, { "epoch": 2.6, "learning_rate": 0.0024666666666666665, "loss": 0.8353, "step": 130 }, { "epoch": 2.8, "learning_rate": 0.0024000000000000002, "loss": 0.8486, "step": 140 }, { "epoch": 3.0, "learning_rate": 0.0023333333333333335, "loss": 0.8277, "step": 150 }, { "epoch": 3.0, "eval_accuracy": 0.49661665195645777, "eval_loss": 1.385775089263916, "eval_runtime": 21.7116, "eval_samples_per_second": 313.105, "eval_steps_per_second": 1.244, "step": 150 }, { "epoch": 3.2, "learning_rate": 0.002266666666666667, "loss": 0.8015, "step": 160 }, { "epoch": 3.4, "learning_rate": 0.0021999999999999997, "loss": 0.785, "step": 170 }, { "epoch": 3.6, "learning_rate": 0.0021333333333333334, "loss": 0.774, "step": 180 }, { "epoch": 3.8, "learning_rate": 0.0020666666666666667, "loss": 0.786, "step": 190 }, { "epoch": 4.0, "learning_rate": 0.002, "loss": 0.7689, "step": 200 }, { "epoch": 4.0, "eval_accuracy": 0.4974992644895557, "eval_loss": 1.4112099409103394, "eval_runtime": 21.6612, "eval_samples_per_second": 313.834, "eval_steps_per_second": 1.246, "step": 200 }, { "epoch": 4.2, "learning_rate": 0.0019333333333333336, "loss": 0.7651, "step": 210 }, { "epoch": 4.4, "learning_rate": 0.0018666666666666666, "loss": 0.7522, "step": 220 }, { "epoch": 4.6, "learning_rate": 0.0018, "loss": 0.7233, "step": 230 }, { "epoch": 4.8, "learning_rate": 0.0017333333333333333, "loss": 0.7468, "step": 240 }, { "epoch": 5.0, "learning_rate": 0.0016666666666666668, "loss": 0.7154, "step": 250 }, { "epoch": 5.0, "eval_accuracy": 0.5035304501323918, "eval_loss": 1.4042478799819946, "eval_runtime": 21.7185, "eval_samples_per_second": 313.005, "eval_steps_per_second": 1.243, "step": 250 }, { "epoch": 5.2, "learning_rate": 0.0016, "loss": 0.7428, "step": 260 }, { "epoch": 5.4, "learning_rate": 0.0015333333333333332, "loss": 0.716, "step": 270 }, { "epoch": 5.6, "learning_rate": 0.0014666666666666667, "loss": 0.7405, "step": 280 }, { "epoch": 5.8, "learning_rate": 0.0014, "loss": 0.7036, "step": 290 }, { "epoch": 6.0, "learning_rate": 0.0013333333333333333, "loss": 0.706, "step": 300 }, { "epoch": 6.0, "eval_accuracy": 0.5170638423065608, "eval_loss": 1.3634626865386963, "eval_runtime": 21.6655, "eval_samples_per_second": 313.771, "eval_steps_per_second": 1.246, "step": 300 }, { "epoch": 6.2, "learning_rate": 0.0012666666666666666, "loss": 0.7359, "step": 310 }, { "epoch": 6.4, "learning_rate": 0.0012000000000000001, "loss": 0.6991, "step": 320 }, { "epoch": 6.6, "learning_rate": 0.0011333333333333334, "loss": 0.7054, "step": 330 }, { "epoch": 6.8, "learning_rate": 0.0010666666666666667, "loss": 0.7025, "step": 340 }, { "epoch": 7.0, "learning_rate": 0.001, "loss": 0.6878, "step": 350 }, { "epoch": 7.0, "eval_accuracy": 0.4873492203589291, "eval_loss": 1.4373207092285156, "eval_runtime": 21.7215, "eval_samples_per_second": 312.962, "eval_steps_per_second": 1.243, "step": 350 }, { "epoch": 7.2, "learning_rate": 0.0009333333333333333, "loss": 0.7044, "step": 360 }, { "epoch": 7.4, "learning_rate": 0.0008666666666666666, "loss": 0.6977, "step": 370 }, { "epoch": 7.6, "learning_rate": 0.0008, "loss": 0.689, "step": 380 }, { "epoch": 7.8, "learning_rate": 0.0007333333333333333, "loss": 0.6834, "step": 390 }, { "epoch": 8.0, "learning_rate": 0.0006666666666666666, "loss": 0.6868, "step": 400 }, { "epoch": 8.0, "eval_accuracy": 0.550456016475434, "eval_loss": 1.2890361547470093, "eval_runtime": 21.8242, "eval_samples_per_second": 311.489, "eval_steps_per_second": 1.237, "step": 400 }, { "epoch": 8.2, "learning_rate": 0.0006000000000000001, "loss": 0.6856, "step": 410 }, { "epoch": 8.4, "learning_rate": 0.0005333333333333334, "loss": 0.6864, "step": 420 }, { "epoch": 8.6, "learning_rate": 0.00046666666666666666, "loss": 0.696, "step": 430 }, { "epoch": 8.8, "learning_rate": 0.0004, "loss": 0.6677, "step": 440 }, { "epoch": 9.0, "learning_rate": 0.0003333333333333333, "loss": 0.6705, "step": 450 }, { "epoch": 9.0, "eval_accuracy": 0.540453074433657, "eval_loss": 1.3018673658370972, "eval_runtime": 21.8437, "eval_samples_per_second": 311.211, "eval_steps_per_second": 1.236, "step": 450 }, { "epoch": 9.2, "learning_rate": 0.0002666666666666667, "loss": 0.6776, "step": 460 }, { "epoch": 9.4, "learning_rate": 0.0002, "loss": 0.6799, "step": 470 }, { "epoch": 9.6, "learning_rate": 0.00013333333333333334, "loss": 0.6752, "step": 480 }, { "epoch": 9.8, "learning_rate": 6.666666666666667e-05, "loss": 0.6807, "step": 490 }, { "epoch": 10.0, "learning_rate": 0.0, "loss": 0.6579, "step": 500 }, { "epoch": 10.0, "eval_accuracy": 0.5272138864371874, "eval_loss": 1.3336907625198364, "eval_runtime": 21.7513, "eval_samples_per_second": 312.533, "eval_steps_per_second": 1.241, "step": 500 }, { "epoch": 10.0, "step": 500, "total_flos": 4.6388411005824e+18, "train_loss": 0.8573982725143433, "train_runtime": 2916.2982, "train_samples_per_second": 175.202, "train_steps_per_second": 0.171 } ], "max_steps": 500, "num_train_epochs": 10, "total_flos": 4.6388411005824e+18, "trial_name": null, "trial_params": null }