Training in progress, step 190000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +123 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:feb517a7d240e3e73a30347675f0925c48b4c67d49c744f7c61da80c7cbb5907
 size 893439185

 version https://git-lfs.github.com/spec/v1
+oid sha256:bdf19b8ac1ef38105671f7e3ed466178582ff690b2e4244bda799fabd849a44a
 size 893439185

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:41f052da26766284555376f7008fbf54434a0f94e18219790a1add696aa730b3
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:34cdc450f36015ade18e6cf8d347ba98eed346e9fca052902560b578799df39f
 size 449471589

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:93a801e054b84a74c1aa696aa3eb20a01eba526d71ba963d6ff62baa4215cff4
 size 15587

 version https://git-lfs.github.com/spec/v1
+oid sha256:4e2a05b33f27bc07e845ac5ddf394e12d5aa9e01cff4a464ac84d19c70049e32
 size 15587

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7c34d541836f44843b83614838d1ed970e46818ac9660cad2b368bbd3750bc9f
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:09ac2f6b5dab3c2f241653e24158eb8e5933ba687a501a1fa916c1b82a746b90
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c9a56b0f434ebff426094d923d9ec43ec4d1dfb4624425a04e541b139922a1e0
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:2639f53746eae2335e88ed02acce8977dcbe3ece7ab8cbccde5b25d715fd5406
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.15,
-  "global_step": 180000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2326,11 +2326,131 @@
       "learning_rate": 1.2236361151893606e-05,
       "loss": 0.3715,
       "step": 180000
     }
   ],
   "max_steps": 200000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 4.238875212565709e+21,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.2,
+  "global_step": 190000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 1.2236361151893606e-05,
       "loss": 0.3715,
       "step": 180000
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 1.2127172828691041e-05,
+      "loss": 0.373,
+      "step": 180500
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 1.2020863570515961e-05,
+      "loss": 0.3743,
+      "step": 181000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 1.1917013848007706e-05,
+      "loss": 0.3745,
+      "step": 181500
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 1.1815845782614282e-05,
+      "loss": 0.3729,
+      "step": 182000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 1.1717365614858533e-05,
+      "loss": 0.373,
+      "step": 182500
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1.162157941946108e-05,
+      "loss": 0.3733,
+      "step": 183000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1.1528493104965648e-05,
+      "loss": 0.3736,
+      "step": 183500
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1.1438112413374588e-05,
+      "loss": 0.3744,
+      "step": 184000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1.1350442919794692e-05,
+      "loss": 0.3743,
+      "step": 184500
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 1.126582442516417e-05,
+      "loss": 0.3733,
+      "step": 185000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 1.1183582486034581e-05,
+      "loss": 0.3739,
+      "step": 185500
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 1.1104067445521018e-05,
+      "loss": 0.3735,
+      "step": 186000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 1.102728420848572e-05,
+      "loss": 0.3732,
+      "step": 186500
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 1.0953237511280449e-05,
+      "loss": 0.3731,
+      "step": 187000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 1.0882071794057046e-05,
+      "loss": 0.3732,
+      "step": 187500
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 1.0813506214785774e-05,
+      "loss": 0.3732,
+      "step": 188000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 1.0747690362178142e-05,
+      "loss": 0.3732,
+      "step": 188500
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 1.0684628296065977e-05,
+      "loss": 0.373,
+      "step": 189000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 1.062444176053193e-05,
+      "loss": 0.3728,
+      "step": 189500
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 1.0566893240808188e-05,
+      "loss": 0.3743,
+      "step": 190000
     }
   ],
   "max_steps": 200000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 4.4743682799304704e+21,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:41f052da26766284555376f7008fbf54434a0f94e18219790a1add696aa730b3
 size 449471589

 version https://git-lfs.github.com/spec/v1
+oid sha256:34cdc450f36015ade18e6cf8d347ba98eed346e9fca052902560b578799df39f
 size 449471589