Training in progress, step 1000, checkpoint

Files changed (4) hide show

checkpoint-1000/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51f483e00995d1286d4da9b53956ffd9ea573042fc6a53446b8be32a056a6c7e
 size 1711848436

 version https://git-lfs.github.com/spec/v1
+oid sha256:97c7b11bb3212e71d95746c24f944f560f1e269e3a0e9aa9d1e3b2e40d25c4db
 size 1711848436

checkpoint-1000/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f9ae42e9ef6b012886a0fb38fb825ea5f5c25b39ae0cf48871830669adf961f2
 size 3424043887

 version https://git-lfs.github.com/spec/v1
+oid sha256:6f16b5f55a9dad5b96f2ebc49eabe04769070bad1f77c15e6e780ee66a770378
 size 3424043887

checkpoint-1000/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9588962197303772,
   "best_model_checkpoint": "./output/clip-finetuned-csu-p14-336-e4l57-l/checkpoint-1000",
   "epoch": 0.10665529010238908,
   "eval_steps": 500,
@@ -10,32 +10,32 @@
   "log_history": [
     {
       "epoch": 0.05332764505119454,
-      "grad_norm": 414.2552795410156,
       "learning_rate": 4.911120591581342e-07,
-      "loss": 0.3809,
       "step": 500
     },
     {
       "epoch": 0.05332764505119454,
-      "eval_loss": 1.1109352111816406,
-      "eval_runtime": 63.6734,
-      "eval_samples_per_second": 15.501,
-      "eval_steps_per_second": 1.947,
       "step": 500
     },
     {
       "epoch": 0.10665529010238908,
-      "grad_norm": 45.880027770996094,
       "learning_rate": 4.822241183162685e-07,
-      "loss": 0.2649,
       "step": 1000
     },
     {
       "epoch": 0.10665529010238908,
-      "eval_loss": 0.9588962197303772,
-      "eval_runtime": 62.6825,
-      "eval_samples_per_second": 15.746,
-      "eval_steps_per_second": 1.978,
       "step": 1000
     }
   ],

 {
+  "best_metric": 0.9644754528999329,
   "best_model_checkpoint": "./output/clip-finetuned-csu-p14-336-e4l57-l/checkpoint-1000",
   "epoch": 0.10665529010238908,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.05332764505119454,
+      "grad_norm": 401.61187744140625,
       "learning_rate": 4.911120591581342e-07,
+      "loss": 0.3808,
       "step": 500
     },
     {
       "epoch": 0.05332764505119454,
+      "eval_loss": 1.1107642650604248,
+      "eval_runtime": 62.4169,
+      "eval_samples_per_second": 15.813,
+      "eval_steps_per_second": 1.987,
       "step": 500
     },
     {
       "epoch": 0.10665529010238908,
+      "grad_norm": 42.57551193237305,
       "learning_rate": 4.822241183162685e-07,
+      "loss": 0.2666,
       "step": 1000
     },
     {
       "epoch": 0.10665529010238908,
+      "eval_loss": 0.9644754528999329,
+      "eval_runtime": 63.4304,
+      "eval_samples_per_second": 15.56,
+      "eval_steps_per_second": 1.955,
       "step": 1000
     }
   ],

checkpoint-1000/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:057f6bbf1ff3e34abda0863071bbf5fdcc7edb1102f04dba05c7a15087bc3396
 size 4847

 version https://git-lfs.github.com/spec/v1
+oid sha256:54c5f1c69a0ead76c168a8c74b80758f8f8eb77228d72de2bfc13a6b8cdc784b
 size 4847