Training in progress, epoch 1

Browse files

Files changed (8) hide show

all_results.json +13 -13
eval_results.json +8 -8
model.safetensors +1 -1
runs/May28_14-57-40_RTX3090/events.out.tfevents.1716876157.RTX3090.403009.1 +3 -0
runs/May28_16-57-52_RTX3090/events.out.tfevents.1716883073.RTX3090.462376.0 +3 -0
train_results.json +5 -5
trainer_state.json +138 -138
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
     "epoch": 12.0,
-    "eval_AUC": 0.9545454545454545,
-    "eval_F1": 0.9735863095238095,
-    "eval_Precision": 0.9896373056994818,
     "eval_Recall": 1.0,
-    "eval_accuracy": 0.9906103286384976,
-    "eval_loss": 0.048169028013944626,
-    "eval_runtime": 4.3355,
-    "eval_samples_per_second": 49.129,
-    "eval_steps_per_second": 3.229,
-    "total_flos": 7.894883901934633e+17,
-    "train_loss": 0.09885871769101531,
-    "train_runtime": 224.7245,
-    "train_samples_per_second": 45.336,
-    "train_steps_per_second": 2.884
 }

 {
     "epoch": 12.0,
+    "eval_AUC": 0.5,
+    "eval_F1": 0.47572815533980584,
+    "eval_Precision": 0.9074074074074074,
     "eval_Recall": 1.0,
+    "eval_accuracy": 0.9074074074074074,
+    "eval_loss": 0.3346473276615143,
+    "eval_runtime": 5.474,
+    "eval_samples_per_second": 59.189,
+    "eval_steps_per_second": 3.836,
+    "total_flos": 6.862690600268268e+17,
+    "train_loss": 0.03526242822408676,
+    "train_runtime": 251.233,
+    "train_samples_per_second": 35.25,
+    "train_steps_per_second": 2.245
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
     "epoch": 12.0,
-    "eval_AUC": 0.9545454545454545,
-    "eval_F1": 0.9735863095238095,
-    "eval_Precision": 0.9896373056994818,
     "eval_Recall": 1.0,
-    "eval_accuracy": 0.9906103286384976,
-    "eval_loss": 0.048169028013944626,
-    "eval_runtime": 4.3355,
-    "eval_samples_per_second": 49.129,
-    "eval_steps_per_second": 3.229
 }

 {
     "epoch": 12.0,
+    "eval_AUC": 0.5,
+    "eval_F1": 0.47572815533980584,
+    "eval_Precision": 0.9074074074074074,
     "eval_Recall": 1.0,
+    "eval_accuracy": 0.9074074074074074,
+    "eval_loss": 0.3346473276615143,
+    "eval_runtime": 5.474,
+    "eval_samples_per_second": 59.189,
+    "eval_steps_per_second": 3.836
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:af75b5d80d0a947cbd9ccf5fce3cf17bcc53c8b31f24138f4c52358b89462ed7
 size 343223968

 version https://git-lfs.github.com/spec/v1
+oid sha256:760373362287b69643cb264294c3cdca3c69105ed8734ed2b2cb181e5b3d2411
 size 343223968

runs/May28_14-57-40_RTX3090/events.out.tfevents.1716876157.RTX3090.403009.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f12bff649f6e82654f424ea5b85d1e418260fe8ed73237ec9b7d9baddfbbe000
+size 607

runs/May28_16-57-52_RTX3090/events.out.tfevents.1716883073.RTX3090.462376.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e62d86463f7c212e69f5465846e3d3f7c8215cf17e293ba833e7ddfc7a674f2c
+size 5634

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 12.0,
-    "total_flos": 7.894883901934633e+17,
-    "train_loss": 0.09885871769101531,
-    "train_runtime": 224.7245,
-    "train_samples_per_second": 45.336,
-    "train_steps_per_second": 2.884
 }

 {
     "epoch": 12.0,
+    "total_flos": 6.862690600268268e+17,
+    "train_loss": 0.03526242822408676,
+    "train_runtime": 251.233,
+    "train_samples_per_second": 35.25,
+    "train_steps_per_second": 2.245
 }

trainer_state.json CHANGED Viewed

@@ -1,195 +1,195 @@
 {
-  "best_metric": 0.048169028013944626,
-  "best_model_checkpoint": "google/vit-base-patch16-224-in21k_covid_19_ct_scans/checkpoint-432",
   "epoch": 12.0,
   "eval_steps": 500,
-  "global_step": 648,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.018518518518518517,
-      "grad_norm": 3.8348426818847656,
-      "learning_rate": 0.00019969135802469138,
-      "loss": 0.6804,
       "step": 1
     },
     {
       "epoch": 1.0,
       "eval_AUC": 0.5,
-      "eval_F1": 0.47277227722772275,
-      "eval_Precision": 0.8967136150234741,
       "eval_Recall": 1.0,
-      "eval_accuracy": 0.8967136150234741,
-      "eval_loss": 0.38209885358810425,
-      "eval_runtime": 4.2504,
-      "eval_samples_per_second": 50.113,
-      "eval_steps_per_second": 3.294,
-      "step": 54
     },
     {
       "epoch": 2.0,
-      "eval_AUC": 0.5,
-      "eval_F1": 0.47277227722772275,
-      "eval_Precision": 0.8967136150234741,
-      "eval_Recall": 1.0,
-      "eval_accuracy": 0.8967136150234741,
-      "eval_loss": 0.413409024477005,
-      "eval_runtime": 4.3554,
-      "eval_samples_per_second": 48.904,
-      "eval_steps_per_second": 3.214,
-      "step": 108
     },
     {
       "epoch": 3.0,
-      "eval_AUC": 0.5454545454545454,
-      "eval_F1": 0.5584577114427861,
-      "eval_Precision": 0.9052132701421801,
       "eval_Recall": 1.0,
-      "eval_accuracy": 0.9061032863849765,
-      "eval_loss": 0.27077189087867737,
-      "eval_runtime": 4.2214,
-      "eval_samples_per_second": 50.458,
-      "eval_steps_per_second": 3.316,
-      "step": 162
     },
     {
       "epoch": 4.0,
-      "eval_AUC": 0.7272727272727273,
-      "eval_F1": 0.797271573604061,
-      "eval_Precision": 0.9408866995073891,
-      "eval_Recall": 1.0,
-      "eval_accuracy": 0.9436619718309859,
-      "eval_loss": 0.2405475229024887,
-      "eval_runtime": 4.1493,
-      "eval_samples_per_second": 51.335,
-      "eval_steps_per_second": 3.374,
-      "step": 216
     },
     {
       "epoch": 5.0,
-      "eval_AUC": 0.7272727272727273,
-      "eval_F1": 0.797271573604061,
-      "eval_Precision": 0.9408866995073891,
-      "eval_Recall": 1.0,
-      "eval_accuracy": 0.9436619718309859,
-      "eval_loss": 0.21931496262550354,
-      "eval_runtime": 4.3053,
-      "eval_samples_per_second": 49.474,
-      "eval_steps_per_second": 3.252,
-      "step": 270
     },
     {
       "epoch": 6.0,
-      "eval_AUC": 0.9309852451213707,
-      "eval_F1": 0.8774901960784314,
-      "eval_Precision": 0.9891304347826086,
-      "eval_Recall": 0.9528795811518325,
-      "eval_accuracy": 0.9483568075117371,
-      "eval_loss": 0.1719074547290802,
-      "eval_runtime": 4.1609,
-      "eval_samples_per_second": 51.191,
-      "eval_steps_per_second": 3.365,
-      "step": 324
     },
     {
       "epoch": 7.0,
-      "eval_AUC": 0.9519276534983341,
-      "eval_F1": 0.9611998299836055,
-      "eval_Precision": 0.9895833333333334,
-      "eval_Recall": 0.9947643979057592,
-      "eval_accuracy": 0.9859154929577465,
-      "eval_loss": 0.05248570814728737,
-      "eval_runtime": 4.1623,
-      "eval_samples_per_second": 51.174,
-      "eval_steps_per_second": 3.364,
-      "step": 378
     },
     {
       "epoch": 8.0,
-      "eval_AUC": 0.9545454545454545,
-      "eval_F1": 0.9735863095238095,
-      "eval_Precision": 0.9896373056994818,
-      "eval_Recall": 1.0,
-      "eval_accuracy": 0.9906103286384976,
-      "eval_loss": 0.048169028013944626,
-      "eval_runtime": 4.2766,
-      "eval_samples_per_second": 49.806,
-      "eval_steps_per_second": 3.274,
-      "step": 432
     },
     {
       "epoch": 9.0,
-      "eval_AUC": 0.8863636363636364,
-      "eval_F1": 0.9294374875770225,
-      "eval_Precision": 0.9744897959183674,
-      "eval_Recall": 1.0,
-      "eval_accuracy": 0.9765258215962441,
-      "eval_loss": 0.09067811071872711,
-      "eval_runtime": 4.2163,
-      "eval_samples_per_second": 50.519,
-      "eval_steps_per_second": 3.32,
-      "step": 486
     },
     {
-      "epoch": 9.25925925925926,
-      "grad_norm": 0.03957719728350639,
-      "learning_rate": 4.567901234567901e-05,
-      "loss": 0.1258,
-      "step": 500
     },
     {
-      "epoch": 10.0,
-      "eval_AUC": 0.8863636363636364,
-      "eval_F1": 0.9294374875770225,
-      "eval_Precision": 0.9744897959183674,
-      "eval_Recall": 1.0,
-      "eval_accuracy": 0.9765258215962441,
-      "eval_loss": 0.10092553496360779,
-      "eval_runtime": 4.2027,
-      "eval_samples_per_second": 50.682,
-      "eval_steps_per_second": 3.331,
-      "step": 540
     },
     {
       "epoch": 11.0,
-      "eval_AUC": 0.8863636363636364,
-      "eval_F1": 0.9294374875770225,
-      "eval_Precision": 0.9744897959183674,
-      "eval_Recall": 1.0,
-      "eval_accuracy": 0.9765258215962441,
-      "eval_loss": 0.10514290630817413,
-      "eval_runtime": 4.2216,
-      "eval_samples_per_second": 50.454,
-      "eval_steps_per_second": 3.316,
-      "step": 594
     },
     {
       "epoch": 12.0,
-      "eval_AUC": 0.8863636363636364,
-      "eval_F1": 0.9294374875770225,
-      "eval_Precision": 0.9744897959183674,
-      "eval_Recall": 1.0,
-      "eval_accuracy": 0.9765258215962441,
-      "eval_loss": 0.10642894357442856,
-      "eval_runtime": 4.2244,
-      "eval_samples_per_second": 50.421,
-      "eval_steps_per_second": 3.314,
-      "step": 648
     },
     {
       "epoch": 12.0,
-      "step": 648,
-      "total_flos": 7.894883901934633e+17,
-      "train_loss": 0.09885871769101531,
-      "train_runtime": 224.7245,
-      "train_samples_per_second": 45.336,
-      "train_steps_per_second": 2.884
     }
   ],
   "logging_steps": 500,
-  "max_steps": 648,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 12,
   "save_steps": 500,
@@ -205,7 +205,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 7.894883901934633e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.3346473276615143,
+  "best_model_checkpoint": "google/vit-base-patch16-224-in21k_covid_19_ct_scans/checkpoint-47",
   "epoch": 12.0,
   "eval_steps": 500,
+  "global_step": 564,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.02127659574468085,
+      "grad_norm": 4.243431091308594,
+      "learning_rate": 0.000199645390070922,
+      "loss": 0.7767,
       "step": 1
     },
     {
       "epoch": 1.0,
       "eval_AUC": 0.5,
+      "eval_F1": 0.47572815533980584,
+      "eval_Precision": 0.9074074074074074,
       "eval_Recall": 1.0,
+      "eval_accuracy": 0.9074074074074074,
+      "eval_loss": 0.3346473276615143,
+      "eval_runtime": 5.5299,
+      "eval_samples_per_second": 58.591,
+      "eval_steps_per_second": 3.798,
+      "step": 47
     },
     {
       "epoch": 2.0,
+      "eval_AUC": 0.6204081632653061,
+      "eval_F1": 0.5919028340080972,
+      "eval_Precision": 0.9311594202898551,
+      "eval_Recall": 0.8741496598639455,
+      "eval_accuracy": 0.8271604938271605,
+      "eval_loss": 0.5513330698013306,
+      "eval_runtime": 5.5902,
+      "eval_samples_per_second": 57.959,
+      "eval_steps_per_second": 3.757,
+      "step": 94
     },
     {
       "epoch": 3.0,
+      "eval_AUC": 0.5,
+      "eval_F1": 0.47572815533980584,
+      "eval_Precision": 0.9074074074074074,
       "eval_Recall": 1.0,
+      "eval_accuracy": 0.9074074074074074,
+      "eval_loss": 0.4290040135383606,
+      "eval_runtime": 5.491,
+      "eval_samples_per_second": 59.005,
+      "eval_steps_per_second": 3.824,
+      "step": 141
     },
     {
       "epoch": 4.0,
+      "eval_AUC": 0.5965986394557823,
+      "eval_F1": 0.6365832614322692,
+      "eval_Precision": 0.9240506329113924,
+      "eval_Recall": 0.9931972789115646,
+      "eval_accuracy": 0.9197530864197531,
+      "eval_loss": 0.433300256729126,
+      "eval_runtime": 5.3718,
+      "eval_samples_per_second": 60.315,
+      "eval_steps_per_second": 3.909,
+      "step": 188
     },
     {
       "epoch": 5.0,
+      "eval_AUC": 0.5897959183673469,
+      "eval_F1": 0.618104667609618,
+      "eval_Precision": 0.9230769230769231,
+      "eval_Recall": 0.9795918367346939,
+      "eval_accuracy": 0.9074074074074074,
+      "eval_loss": 0.5040868520736694,
+      "eval_runtime": 5.759,
+      "eval_samples_per_second": 56.26,
+      "eval_steps_per_second": 3.646,
+      "step": 235
     },
     {
       "epoch": 6.0,
+      "eval_AUC": 0.5948979591836735,
+      "eval_F1": 0.6316786661614249,
+      "eval_Precision": 0.9238095238095239,
+      "eval_Recall": 0.9897959183673469,
+      "eval_accuracy": 0.9166666666666666,
+      "eval_loss": 0.4848092496395111,
+      "eval_runtime": 13.7532,
+      "eval_samples_per_second": 23.558,
+      "eval_steps_per_second": 1.527,
+      "step": 282
     },
     {
       "epoch": 7.0,
+      "eval_AUC": 0.5965986394557823,
+      "eval_F1": 0.6365832614322692,
+      "eval_Precision": 0.9240506329113924,
+      "eval_Recall": 0.9931972789115646,
+      "eval_accuracy": 0.9197530864197531,
+      "eval_loss": 0.48772257566452026,
+      "eval_runtime": 5.5683,
+      "eval_samples_per_second": 58.186,
+      "eval_steps_per_second": 3.771,
+      "step": 329
     },
     {
       "epoch": 8.0,
+      "eval_AUC": 0.5965986394557823,
+      "eval_F1": 0.6365832614322692,
+      "eval_Precision": 0.9240506329113924,
+      "eval_Recall": 0.9931972789115646,
+      "eval_accuracy": 0.9197530864197531,
+      "eval_loss": 0.49257075786590576,
+      "eval_runtime": 5.2567,
+      "eval_samples_per_second": 61.635,
+      "eval_steps_per_second": 3.995,
+      "step": 376
     },
     {
       "epoch": 9.0,
+      "eval_AUC": 0.5965986394557823,
+      "eval_F1": 0.6365832614322692,
+      "eval_Precision": 0.9240506329113924,
+      "eval_Recall": 0.9931972789115646,
+      "eval_accuracy": 0.9197530864197531,
+      "eval_loss": 0.49581947922706604,
+      "eval_runtime": 5.6218,
+      "eval_samples_per_second": 57.633,
+      "eval_steps_per_second": 3.735,
+      "step": 423
     },
     {
+      "epoch": 10.0,
+      "eval_AUC": 0.5965986394557823,
+      "eval_F1": 0.6365832614322692,
+      "eval_Precision": 0.9240506329113924,
+      "eval_Recall": 0.9931972789115646,
+      "eval_accuracy": 0.9197530864197531,
+      "eval_loss": 0.4980551600456238,
+      "eval_runtime": 5.5112,
+      "eval_samples_per_second": 58.79,
+      "eval_steps_per_second": 3.81,
+      "step": 470
     },
     {
+      "epoch": 10.638297872340425,
+      "grad_norm": 0.012480547651648521,
+      "learning_rate": 2.269503546099291e-05,
+      "loss": 0.0381,
+      "step": 500
     },
     {
       "epoch": 11.0,
+      "eval_AUC": 0.5965986394557823,
+      "eval_F1": 0.6365832614322692,
+      "eval_Precision": 0.9240506329113924,
+      "eval_Recall": 0.9931972789115646,
+      "eval_accuracy": 0.9197530864197531,
+      "eval_loss": 0.4996081292629242,
+      "eval_runtime": 5.5015,
+      "eval_samples_per_second": 58.893,
+      "eval_steps_per_second": 3.817,
+      "step": 517
     },
     {
       "epoch": 12.0,
+      "eval_AUC": 0.5965986394557823,
+      "eval_F1": 0.6365832614322692,
+      "eval_Precision": 0.9240506329113924,
+      "eval_Recall": 0.9931972789115646,
+      "eval_accuracy": 0.9197530864197531,
+      "eval_loss": 0.5001835823059082,
+      "eval_runtime": 5.5423,
+      "eval_samples_per_second": 58.46,
+      "eval_steps_per_second": 3.789,
+      "step": 564
     },
     {
       "epoch": 12.0,
+      "step": 564,
+      "total_flos": 6.862690600268268e+17,
+      "train_loss": 0.03526242822408676,
+      "train_runtime": 251.233,
+      "train_samples_per_second": 35.25,
+      "train_steps_per_second": 2.245
     }
   ],
   "logging_steps": 500,
+  "max_steps": 564,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 12,
   "save_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 6.862690600268268e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:357df7b508e81337a045bc900ffa166dacc0301c45e85247db7b83a80952fefb
 size 4731

 version https://git-lfs.github.com/spec/v1
+oid sha256:860ac9cc2700a6acca98170286a713aa05b047089895c0cc3d2037638dcd625e
 size 4731