Training in progress, epoch 13

Browse files

Files changed (10) hide show

all_results.json +14 -0
eval_results.json +9 -0
logs/1674298259.6394777/events.out.tfevents.1674298259.gifu.1218844.1 +3 -0
logs/1674299037.2365105/events.out.tfevents.1674299037.serv-3331.1578155.1 +3 -0
logs/events.out.tfevents.1674211481.serv-3329.596619.2 +3 -0
logs/events.out.tfevents.1674298259.gifu.1218844.0 +3 -0
logs/events.out.tfevents.1674299037.serv-3331.1578155.0 +3 -0
pytorch_model.bin +1 -1
train_results.json +8 -0
trainer_state.json +205 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 12.0,
+    "eval_loss": 0.6131083965301514,
+    "eval_matthews_correlation": 0.0,
+    "eval_runtime": 1.6031,
+    "eval_samples": 1043,
+    "eval_samples_per_second": 650.606,
+    "eval_steps_per_second": 3.119,
+    "train_loss": 0.5614397408915501,
+    "train_runtime": 608.6002,
+    "train_samples": 8551,
+    "train_samples_per_second": 702.514,
+    "train_steps_per_second": 2.793
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 12.0,
+    "eval_loss": 0.6131083965301514,
+    "eval_matthews_correlation": 0.0,
+    "eval_runtime": 1.6031,
+    "eval_samples": 1043,
+    "eval_samples_per_second": 650.606,
+    "eval_steps_per_second": 3.119
+}

logs/1674298259.6394777/events.out.tfevents.1674298259.gifu.1218844.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b51650b3f5fbcf0d2bb2532709ac86f6fdb2846a362fdd74e4bbfecf9fe4e1d0
+size 5575

logs/1674299037.2365105/events.out.tfevents.1674299037.serv-3331.1578155.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e0102f89ce7bc0b697414b4034bb4750faecc792d00864614dc78fb710cf4975
+size 5575

logs/events.out.tfevents.1674211481.serv-3329.596619.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f0ffe5a319db96fba78d3b0863616e6df15710e9dc156b53524948801fff770f
+size 375

logs/events.out.tfevents.1674298259.gifu.1218844.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:55c8304c10148085e0a31d198b247a46d3380780bb3a6196eafb02d9184fe52a
+size 4047

logs/events.out.tfevents.1674299037.serv-3331.1578155.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5ac5e832cfbd1b7fe5324bfdee753360a8d1e14fee7e1afab159ff670d1b08bb
+size 4539

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8175bfc3e61cb3e4e31b0cdcb2f23c51ecad64b4bb6d60f61a3622eb1eef4cd0
 size 99795697

 version https://git-lfs.github.com/spec/v1
+oid sha256:a94a41abe9843609cdf3f9a87acc8ea27193651e472bb7a0ee9a2c64c1b5715b
 size 99795697

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 12.0,
+    "train_loss": 0.5614397408915501,
+    "train_runtime": 608.6002,
+    "train_samples": 8551,
+    "train_samples_per_second": 702.514,
+    "train_steps_per_second": 2.793
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,205 @@

+{
+  "best_metric": 0.6131083965301514,
+  "best_model_checkpoint": "mobilebert_sa_GLUE_Experiment_cola/checkpoint-238",
+  "epoch": 12.0,
+  "global_step": 408,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 4.9e-05,
+      "loss": 0.6197,
+      "step": 34
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.6238651871681213,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 1.5899,
+      "eval_samples_per_second": 656.009,
+      "eval_steps_per_second": 3.145,
+      "step": 34
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 4.8e-05,
+      "loss": 0.6078,
+      "step": 68
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.6178815364837646,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 1.5812,
+      "eval_samples_per_second": 659.606,
+      "eval_steps_per_second": 3.162,
+      "step": 68
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 4.7e-05,
+      "loss": 0.6064,
+      "step": 102
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 0.6179934144020081,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 2.4438,
+      "eval_samples_per_second": 426.802,
+      "eval_steps_per_second": 2.046,
+      "step": 102
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 4.600000000000001e-05,
+      "loss": 0.6073,
+      "step": 136
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 0.6175711750984192,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 1.7323,
+      "eval_samples_per_second": 602.096,
+      "eval_steps_per_second": 2.886,
+      "step": 136
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 4.5e-05,
+      "loss": 0.6069,
+      "step": 170
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 0.6172661781311035,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 1.7156,
+      "eval_samples_per_second": 607.942,
+      "eval_steps_per_second": 2.914,
+      "step": 170
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 4.4000000000000006e-05,
+      "loss": 0.6043,
+      "step": 204
+    },
+    {
+      "epoch": 6.0,
+      "eval_loss": 0.6166184544563293,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 1.9408,
+      "eval_samples_per_second": 537.405,
+      "eval_steps_per_second": 2.576,
+      "step": 204
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 4.3e-05,
+      "loss": 0.6004,
+      "step": 238
+    },
+    {
+      "epoch": 7.0,
+      "eval_loss": 0.6131083965301514,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 1.7507,
+      "eval_samples_per_second": 595.751,
+      "eval_steps_per_second": 2.856,
+      "step": 238
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 4.2e-05,
+      "loss": 0.5842,
+      "step": 272
+    },
+    {
+      "epoch": 8.0,
+      "eval_loss": 0.6240708231925964,
+      "eval_matthews_correlation": 0.0951039122870703,
+      "eval_runtime": 1.7156,
+      "eval_samples_per_second": 607.967,
+      "eval_steps_per_second": 2.915,
+      "step": 272
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 4.1e-05,
+      "loss": 0.5192,
+      "step": 306
+    },
+    {
+      "epoch": 9.0,
+      "eval_loss": 0.6361746191978455,
+      "eval_matthews_correlation": 0.059760920069176514,
+      "eval_runtime": 1.9833,
+      "eval_samples_per_second": 525.879,
+      "eval_steps_per_second": 2.521,
+      "step": 306
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 4e-05,
+      "loss": 0.4884,
+      "step": 340
+    },
+    {
+      "epoch": 10.0,
+      "eval_loss": 0.7009902596473694,
+      "eval_matthews_correlation": 0.08008155523655092,
+      "eval_runtime": 1.7208,
+      "eval_samples_per_second": 606.103,
+      "eval_steps_per_second": 2.906,
+      "step": 340
+    },
+    {
+      "epoch": 11.0,
+      "learning_rate": 3.9000000000000006e-05,
+      "loss": 0.4559,
+      "step": 374
+    },
+    {
+      "epoch": 11.0,
+      "eval_loss": 0.6731011867523193,
+      "eval_matthews_correlation": 0.09051190856095573,
+      "eval_runtime": 1.7848,
+      "eval_samples_per_second": 584.391,
+      "eval_steps_per_second": 2.801,
+      "step": 374
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 3.8e-05,
+      "loss": 0.4367,
+      "step": 408
+    },
+    {
+      "epoch": 12.0,
+      "eval_loss": 0.6893478035926819,
+      "eval_matthews_correlation": 0.09007205990892461,
+      "eval_runtime": 1.959,
+      "eval_samples_per_second": 532.427,
+      "eval_steps_per_second": 2.552,
+      "step": 408
+    },
+    {
+      "epoch": 12.0,
+      "step": 408,
+      "total_flos": 3258721140473856.0,
+      "train_loss": 0.5614397408915501,
+      "train_runtime": 608.6002,
+      "train_samples_per_second": 702.514,
+      "train_steps_per_second": 2.793
+    }
+  ],
+  "max_steps": 1700,
+  "num_train_epochs": 50,
+  "total_flos": 3258721140473856.0,
+  "trial_name": null,
+  "trial_params": null
+}