polejowska
/

cdetr-cd45rb-s

Object Detection

conditional_detr

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

polejowska commited on May 7, 2023

Commit

5430b22

•

1 Parent(s): c4e9ee8

End of training

Files changed (1) hide show

trainer_state.json +84 -14

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 2.0293631553649902,
-  "best_model_checkpoint": "cdetr-cd45rb-s/checkpoint-1210",
-  "epoch": 5.0,
-  "global_step": 1210,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -78,18 +78,88 @@
       "step": 1210
     },
     {
-      "epoch": 5.0,
-      "step": 1210,
-      "total_flos": 2.4107363634816e+18,
-      "train_loss": 1.2896953235973012,
-      "train_runtime": 786.99,
-      "train_samples_per_second": 6.137,
-      "train_steps_per_second": 1.538
     }
   ],
-  "max_steps": 1210,
-  "num_train_epochs": 5,
-  "total_flos": 2.4107363634816e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 2.0136280059814453,
+  "best_model_checkpoint": "cdetr-cd45rb-s/checkpoint-2420",
+  "epoch": 10.0,
+  "global_step": 2420,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "step": 1210
     },
     {
+      "epoch": 6.0,
+      "learning_rate": 4e-05,
+      "loss": 2.1588,
+      "step": 1452
+    },
+    {
+      "epoch": 6.0,
+      "eval_loss": 2.0859251022338867,
+      "eval_runtime": 17.1118,
+      "eval_samples_per_second": 5.844,
+      "eval_steps_per_second": 0.76,
+      "step": 1452
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 3e-05,
+      "loss": 2.1731,
+      "step": 1694
+    },
+    {
+      "epoch": 7.0,
+      "eval_loss": 2.073065757751465,
+      "eval_runtime": 16.6383,
+      "eval_samples_per_second": 6.01,
+      "eval_steps_per_second": 0.781,
+      "step": 1694
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 2e-05,
+      "loss": 2.1041,
+      "step": 1936
+    },
+    {
+      "epoch": 8.0,
+      "eval_loss": 2.1051650047302246,
+      "eval_runtime": 16.6295,
+      "eval_samples_per_second": 6.013,
+      "eval_steps_per_second": 0.782,
+      "step": 1936
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 1e-05,
+      "loss": 2.0383,
+      "step": 2178
+    },
+    {
+      "epoch": 9.0,
+      "eval_loss": 2.037771463394165,
+      "eval_runtime": 17.1339,
+      "eval_samples_per_second": 5.836,
+      "eval_steps_per_second": 0.759,
+      "step": 2178
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 0.0,
+      "loss": 1.967,
+      "step": 2420
+    },
+    {
+      "epoch": 10.0,
+      "eval_loss": 2.0136280059814453,
+      "eval_runtime": 16.8066,
+      "eval_samples_per_second": 5.95,
+      "eval_steps_per_second": 0.774,
+      "step": 2420
+    },
+    {
+      "epoch": 10.0,
+      "step": 2420,
+      "total_flos": 4.8214727269632e+18,
+      "train_loss": 1.0441367535551718,
+      "train_runtime": 1297.7653,
+      "train_samples_per_second": 7.444,
+      "train_steps_per_second": 1.865
     }
   ],
+  "max_steps": 2420,
+  "num_train_epochs": 10,
+  "total_flos": 4.8214727269632e+18,
   "trial_name": null,
   "trial_params": null
 }