Training in progress, epoch 12, checkpoint

Browse files

Files changed (5) hide show

checkpoint-492/model.safetensors +1 -1
checkpoint-492/optimizer.pt +1 -1
checkpoint-492/rng_state.pth +1 -1
checkpoint-492/trainer_state.json +361 -361
checkpoint-492/training_args.bin +1 -1

checkpoint-492/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a6646aa66b3a94c59ffa3908580c116e3110b578a9fc325fbdb06c314dbffa3
 size 592324828

 version https://git-lfs.github.com/spec/v1
+oid sha256:bc431db88957a585280816f57e4b96ae38f064c384dba8a731417633aacd382a
 size 592324828

checkpoint-492/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7372ad8507f8cf9652f5a5281e6d3d7b033168a3ac3e05254ce8fbc9ab3ea257
 size 1014657786

 version https://git-lfs.github.com/spec/v1
+oid sha256:792abab89fd6bbc2028f41f1dd932b0921994ca64b5791503fe505df9851ab7a
 size 1014657786

checkpoint-492/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1c189466643703424c77db24cb1c70bb1b76b65752ddeeaa3d7bb424b6ea3dcb
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:b6e53e706c63ba0c275c9b6332ceadb76c337b40858f3ddadb0ab10622a334eb
 size 14244

checkpoint-492/trainer_state.json CHANGED Viewed

@@ -11,540 +11,540 @@
     {
       "epoch": 1.0,
       "eval_Claim": {
-        "f1-score": 0.47523786289338865,
-        "precision": 0.535017852238396,
-        "recall": 0.4274742154926487,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.5895036615134255,
-        "precision": 0.5474121647147714,
-        "recall": 0.6386073159982371,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8362336114421931,
-        "precision": 0.845403060609712,
-        "recall": 0.8272609362103526,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8706190412246543,
-        "precision": 0.850072112232857,
-        "recall": 0.8921838447777625,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.7834858081163499,
-      "eval_loss": 0.5869407653808594,
       "eval_macro avg": {
-        "f1-score": 0.6928985442684154,
-        "precision": 0.694476297448934,
-        "recall": 0.6963815781197502,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.4026,
-      "eval_samples_per_second": 57.038,
-      "eval_steps_per_second": 7.13,
       "eval_weighted avg": {
-        "f1-score": 0.7790930985214805,
-        "precision": 0.7776202536983177,
-        "recall": 0.7834858081163499,
-        "support": 29841.0
       },
       "step": 41
     },
     {
       "epoch": 2.0,
       "eval_Claim": {
-        "f1-score": 0.5317480394636985,
-        "precision": 0.6276500447894894,
-        "recall": 0.4612683783190696,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.7102803738317758,
-        "precision": 0.6855268552685527,
-        "recall": 0.7368884971353019,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8735280263777673,
-        "precision": 0.872397977184523,
-        "recall": 0.8746610069567268,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.884589815184151,
-        "precision": 0.8556913183279743,
-        "recall": 0.9155084629145452,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.820951040514728,
-      "eval_loss": 0.48614954948425293,
       "eval_macro avg": {
-        "f1-score": 0.7500365637143481,
-        "precision": 0.7603165488926349,
-        "recall": 0.7470815863314109,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.3997,
-      "eval_samples_per_second": 57.154,
-      "eval_steps_per_second": 7.144,
       "eval_weighted avg": {
-        "f1-score": 0.8143098940939201,
-        "precision": 0.8126767385071133,
-        "recall": 0.820951040514728,
-        "support": 29841.0
       },
       "step": 82
     },
     {
       "epoch": 3.0,
       "eval_Claim": {
-        "f1-score": 0.5762534088525278,
-        "precision": 0.5519389190275267,
-        "recall": 0.6028088654816766,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.7533490937746257,
-        "precision": 0.6811542572141076,
-        "recall": 0.8426619656236227,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8863363002165023,
-        "precision": 0.9045047256658892,
-        "recall": 0.868883386393114,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8715370552664885,
-        "precision": 0.8910855499640546,
-        "recall": 0.8528278519333975,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8184377199155525,
-      "eval_loss": 0.46511921286582947,
       "eval_macro avg": {
-        "f1-score": 0.7718689645275361,
-        "precision": 0.7571708629678946,
-        "recall": 0.7917955173579527,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.4011,
-      "eval_samples_per_second": 57.099,
-      "eval_steps_per_second": 7.137,
       "eval_weighted avg": {
-        "f1-score": 0.8216639389194362,
-        "precision": 0.8271460951435015,
-        "recall": 0.8184377199155525,
-        "support": 29841.0
       },
       "step": 123
     },
     {
       "epoch": 4.0,
       "eval_Claim": {
-        "f1-score": 0.5960000000000001,
-        "precision": 0.5727291118753793,
-        "recall": 0.6212420452051789,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.7671584348941629,
-        "precision": 0.7450166112956811,
-        "recall": 0.7906566769501984,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8945798982634625,
-        "precision": 0.8872651356993737,
-        "recall": 0.9020162716660771,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8770509119076122,
-        "precision": 0.8981107585809057,
-        "recall": 0.8569561029310582,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8287255789015113,
-      "eval_loss": 0.46847572922706604,
       "eval_macro avg": {
-        "f1-score": 0.7836973112663095,
-        "precision": 0.7757804043628349,
-        "recall": 0.792717774188128,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.3906,
-      "eval_samples_per_second": 57.529,
-      "eval_steps_per_second": 7.191,
       "eval_weighted avg": {
-        "f1-score": 0.8307578351802057,
-        "precision": 0.8336988249364055,
-        "recall": 0.8287255789015113,
-        "support": 29841.0
       },
       "step": 164
     },
     {
       "epoch": 5.0,
       "eval_Claim": {
-        "f1-score": 0.5957255343082115,
-        "precision": 0.6111239326102008,
-        "recall": 0.5810840465218345,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.7869718309859155,
-        "precision": 0.7859340659340659,
-        "recall": 0.7880123402379903,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8924617196702003,
-        "precision": 0.8915166490175315,
-        "recall": 0.8934087961325315,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8858138581385815,
-        "precision": 0.8798018189222208,
-        "recall": 0.8919086280445852,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8369692704668074,
-      "eval_loss": 0.4714011251926422,
       "eval_macro avg": {
-        "f1-score": 0.7902432357757272,
-        "precision": 0.7920941166210047,
-        "recall": 0.7886034527342354,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.4,
-      "eval_samples_per_second": 57.143,
-      "eval_steps_per_second": 7.143,
       "eval_weighted avg": {
-        "f1-score": 0.8358884354766487,
-        "precision": 0.8349642603479214,
-        "recall": 0.8369692704668074,
-        "support": 29841.0
       },
       "step": 205
     },
     {
       "epoch": 6.0,
       "eval_Claim": {
-        "f1-score": 0.5968608901311546,
-        "precision": 0.5850368809272919,
-        "recall": 0.6091727013385999,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8127323420074349,
-        "precision": 0.8594594594594595,
-        "recall": 0.7708241516086382,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8972979364985514,
-        "precision": 0.8999051233396584,
-        "recall": 0.8947058129937507,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8825566642663649,
-        "precision": 0.8796910246770114,
-        "recall": 0.8854410348149168,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8371703361147415,
-      "eval_loss": 0.5037193298339844,
       "eval_macro avg": {
-        "f1-score": 0.7973619582258764,
-        "precision": 0.8060231221008552,
-        "recall": 0.7900359251889764,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.4008,
-      "eval_samples_per_second": 57.109,
-      "eval_steps_per_second": 7.139,
       "eval_weighted avg": {
-        "f1-score": 0.8378086229762441,
-        "precision": 0.8389012192486348,
-        "recall": 0.8371703361147415,
-        "support": 29841.0
       },
       "step": 246
     },
     {
       "epoch": 7.0,
       "eval_Claim": {
-        "f1-score": 0.6057510824913955,
-        "precision": 0.6130337078651685,
-        "recall": 0.5986394557823129,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.7914081145584726,
-        "precision": 0.8630921395106715,
-        "recall": 0.7307183781401498,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8969556393157437,
-        "precision": 0.8824737562756733,
-        "recall": 0.9119207640608419,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8857729138166894,
-        "precision": 0.880592955256358,
-        "recall": 0.8910141736617586,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8401192989511075,
-      "eval_loss": 0.5329757928848267,
       "eval_macro avg": {
-        "f1-score": 0.7949719375455753,
-        "precision": 0.8097981397269679,
-        "recall": 0.7830731929112658,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.3907,
-      "eval_samples_per_second": 57.526,
-      "eval_steps_per_second": 7.191,
       "eval_weighted avg": {
-        "f1-score": 0.8390140076168712,
-        "precision": 0.8389379916879856,
-        "recall": 0.8401192989511075,
-        "support": 29841.0
       },
       "step": 287
     },
     {
       "epoch": 8.0,
       "eval_Claim": {
-        "f1-score": 0.6007012930089853,
-        "precision": 0.599912453490917,
-        "recall": 0.6014922097871407,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8150046598322461,
-        "precision": 0.8645575877409788,
-        "recall": 0.7708241516086382,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8958295721249322,
-        "precision": 0.9148230088495575,
-        "recall": 0.8776087725504068,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8864303302189092,
-        "precision": 0.8694501422616291,
-        "recall": 0.9040869684876841,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8402198317750745,
-      "eval_loss": 0.5759353637695312,
       "eval_macro avg": {
-        "f1-score": 0.7994914637962682,
-        "precision": 0.8121857980857706,
-        "recall": 0.7885030256084674,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.4002,
-      "eval_samples_per_second": 57.137,
-      "eval_steps_per_second": 7.142,
       "eval_weighted avg": {
-        "f1-score": 0.8400372100799064,
-        "precision": 0.8408124567818104,
-        "recall": 0.8402198317750745,
-        "support": 29841.0
       },
       "step": 328
     },
     {
       "epoch": 9.0,
       "eval_Claim": {
-        "f1-score": 0.6078538018057218,
-        "precision": 0.6026747195858498,
-        "recall": 0.6131226684222076,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8104317335086566,
-        "precision": 0.8060156931124673,
-        "recall": 0.8148964301454386,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8967088304058509,
-        "precision": 0.9120731707317074,
-        "recall": 0.8818535550053059,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8858266370319713,
-        "precision": 0.8804975868397797,
-        "recall": 0.8912205862116417,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8402868536577193,
-      "eval_loss": 0.597597062587738,
       "eval_macro avg": {
-        "f1-score": 0.8002052506880502,
-        "precision": 0.800315292567451,
-        "recall": 0.8002733099461484,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.4006,
-      "eval_samples_per_second": 57.118,
-      "eval_steps_per_second": 7.14,
       "eval_weighted avg": {
-        "f1-score": 0.8407376197665799,
-        "precision": 0.8413820848138425,
-        "recall": 0.8402868536577193,
-        "support": 29841.0
       },
       "step": 369
     },
     {
       "epoch": 10.0,
       "eval_Claim": {
-        "f1-score": 0.6166648417825469,
-        "precision": 0.6153846153846154,
-        "recall": 0.6179504059688391,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8066597294484912,
-        "precision": 0.7641955835962145,
-        "recall": 0.8541207580431909,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8995083343326538,
-        "precision": 0.9150908869098451,
-        "recall": 0.8844475887277443,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8894240693593889,
-        "precision": 0.8894852738783374,
-        "recall": 0.8893628732626944,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8438390134378875,
-      "eval_loss": 0.6327010989189148,
       "eval_macro avg": {
-        "f1-score": 0.8030642437307701,
-        "precision": 0.7960390899422531,
-        "recall": 0.8114704065006171,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.3944,
-      "eval_samples_per_second": 57.373,
-      "eval_steps_per_second": 7.172,
       "eval_weighted avg": {
-        "f1-score": 0.8443440976397001,
-        "precision": 0.8453782465037248,
-        "recall": 0.8438390134378875,
-        "support": 29841.0
       },
       "step": 410
     },
     {
       "epoch": 11.0,
       "eval_Claim": {
-        "f1-score": 0.6205015213513796,
-        "precision": 0.5944913550462404,
-        "recall": 0.6488918147904323,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8115818607621886,
-        "precision": 0.78500823723229,
-        "recall": 0.8400176289114147,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.8931679980922858,
-        "precision": 0.9032919329555047,
-        "recall": 0.8832684824902723,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8841004184100418,
-        "precision": 0.8962250812950657,
-        "recall": 0.872299435805697,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8388458831808585,
-      "eval_loss": 0.6347343325614929,
       "eval_macro avg": {
-        "f1-score": 0.802337949653974,
-        "precision": 0.7947541516322751,
-        "recall": 0.8111193404994541,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.3894,
-      "eval_samples_per_second": 57.578,
-      "eval_steps_per_second": 7.197,
       "eval_weighted avg": {
-        "f1-score": 0.8409094181783406,
-        "precision": 0.843699440707882,
-        "recall": 0.8388458831808585,
-        "support": 29841.0
       },
       "step": 451
     },
     {
       "epoch": 12.0,
       "eval_Claim": {
-        "f1-score": 0.6289669861554845,
-        "precision": 0.6110076557003932,
-        "recall": 0.6480140443274084,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8147826086956521,
-        "precision": 0.803946803946804,
-        "recall": 0.8259144997796386,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9003071107961257,
-        "precision": 0.901905099988167,
-        "recall": 0.8987147742011555,
-        "support": 8481.0
       },
       "eval_Premise": {
-        "f1-score": 0.8883866481223922,
-        "precision": 0.8980036552790664,
-        "recall": 0.8789734415852484,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8452799839147481,
-      "eval_loss": 0.6512799859046936,
       "eval_macro avg": {
-        "f1-score": 0.8081108384424137,
-        "precision": 0.8037158037286076,
-        "recall": 0.8129041899733627,
-        "support": 29841.0
-      },
-      "eval_runtime": 1.3915,
-      "eval_samples_per_second": 57.493,
-      "eval_steps_per_second": 7.187,
       "eval_weighted avg": {
-        "f1-score": 0.8465621274593268,
-        "precision": 0.8481337577161484,
-        "recall": 0.8452799839147481,
-        "support": 29841.0
       },
       "step": 492
     }
@@ -554,7 +554,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 16,
   "save_steps": 500,
-  "total_flos": 1725464792721600.0,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

     {
       "epoch": 1.0,
       "eval_Claim": {
+        "f1-score": 0.3926645091693635,
+        "precision": 0.4813399941228328,
+        "recall": 0.33157894736842103,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.5305101700566855,
+        "precision": 0.41758530183727033,
+        "recall": 0.7271480804387569,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.8568685802054334,
+        "precision": 0.8614998552263295,
+        "recall": 0.8522868328081734,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.8535428122545169,
+        "precision": 0.8528192892126083,
+        "recall": 0.8542675639977357,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.7682686567164179,
+      "eval_loss": 0.6236585974693298,
       "eval_macro avg": {
+        "f1-score": 0.6583965179214999,
+        "precision": 0.6533111100997602,
+        "recall": 0.6913203561532717,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4247,
+      "eval_samples_per_second": 56.854,
+      "eval_steps_per_second": 7.721,
       "eval_weighted avg": {
+        "f1-score": 0.7655218131315448,
+        "precision": 0.7723271066974134,
+        "recall": 0.7682686567164179,
+        "support": 33500.0
       },
       "step": 41
     },
     {
       "epoch": 2.0,
       "eval_Claim": {
+        "f1-score": 0.5235859602056785,
+        "precision": 0.5846230654018971,
+        "recall": 0.47408906882591095,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7206085753803596,
+        "precision": 0.7269767441860465,
+        "recall": 0.7143510054844607,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.8884743765953269,
+        "precision": 0.9142337609859582,
+        "recall": 0.8641268022534135,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.8745201535508637,
+        "precision": 0.8357695614789338,
+        "recall": 0.917038807472168,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8219402985074626,
+      "eval_loss": 0.47505903244018555,
       "eval_macro avg": {
+        "f1-score": 0.7517972664330571,
+        "precision": 0.7654007830132088,
+        "recall": 0.7424014210089883,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4322,
+      "eval_samples_per_second": 56.557,
+      "eval_steps_per_second": 7.681,
       "eval_weighted avg": {
+        "f1-score": 0.8170804260816812,
+        "precision": 0.816159208839521,
+        "recall": 0.8219402985074626,
+        "support": 33500.0
       },
       "step": 82
     },
     {
       "epoch": 3.0,
       "eval_Claim": {
+        "f1-score": 0.5033996474439688,
+        "precision": 0.6658894070619586,
+        "recall": 0.4046558704453441,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7934708682838358,
+        "precision": 0.7872244714349977,
+        "recall": 0.79981718464351,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9017883608339096,
+        "precision": 0.9342819121711536,
+        "recall": 0.8714790413444095,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.8787676209853219,
+        "precision": 0.8168702042580784,
+        "recall": 0.9508145166362665,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8356119402985075,
+      "eval_loss": 0.458564430475235,
       "eval_macro avg": {
+        "f1-score": 0.7693566243867591,
+        "precision": 0.8010664987315472,
+        "recall": 0.7566916532673825,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4302,
+      "eval_samples_per_second": 56.636,
+      "eval_steps_per_second": 7.691,
       "eval_weighted avg": {
+        "f1-score": 0.8250407291712659,
+        "precision": 0.8293759599418965,
+        "recall": 0.8356119402985075,
+        "support": 33500.0
       },
       "step": 123
     },
     {
       "epoch": 4.0,
       "eval_Claim": {
+        "f1-score": 0.6119839240043845,
+        "precision": 0.5575898801597869,
+        "recall": 0.6781376518218624,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8013553578991952,
+        "precision": 0.7466456195737964,
+        "recall": 0.8647166361974405,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9009650063359004,
+        "precision": 0.9201592832254853,
+        "recall": 0.8825551417931825,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.8636894716344281,
+        "precision": 0.8922416683430564,
+        "recall": 0.836907981634065,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8295820895522388,
+      "eval_loss": 0.45249882340431213,
       "eval_macro avg": {
+        "f1-score": 0.7944984399684771,
+        "precision": 0.7791591128255312,
+        "recall": 0.8155793528616375,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4313,
+      "eval_samples_per_second": 56.59,
+      "eval_steps_per_second": 7.685,
       "eval_weighted avg": {
+        "f1-score": 0.8341543739861718,
+        "precision": 0.8421114352783158,
+        "recall": 0.8295820895522388,
+        "support": 33500.0
       },
       "step": 164
     },
     {
       "epoch": 5.0,
       "eval_Claim": {
+        "f1-score": 0.6177297297297297,
+        "precision": 0.662877030162413,
+        "recall": 0.5783400809716599,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8327169893408746,
+        "precision": 0.7945205479452054,
+        "recall": 0.8747714808043876,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9074411905904946,
+        "precision": 0.9125229313507772,
+        "recall": 0.9024157357013273,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.8867988738669058,
+        "precision": 0.8726254262055528,
+        "recall": 0.9014403421598842,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8523582089552239,
+      "eval_loss": 0.47209030389785767,
       "eval_macro avg": {
+        "f1-score": 0.8111716958820011,
+        "precision": 0.8106364839159872,
+        "recall": 0.8142419099093148,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4276,
+      "eval_samples_per_second": 56.738,
+      "eval_steps_per_second": 7.705,
       "eval_weighted avg": {
+        "f1-score": 0.8500422842449816,
+        "precision": 0.8490670984831405,
+        "recall": 0.8523582089552239,
+        "support": 33500.0
       },
       "step": 205
     },
     {
       "epoch": 6.0,
       "eval_Claim": {
+        "f1-score": 0.6278612118073537,
+        "precision": 0.6428419936373276,
+        "recall": 0.6135627530364373,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.83248730964467,
+        "precision": 0.804950917626974,
+        "recall": 0.8619744058500914,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9114601059950406,
+        "precision": 0.9285714285714286,
+        "recall": 0.8949680129857729,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.8842993146649301,
+        "precision": 0.872155615365794,
+        "recall": 0.8967859613812189,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8521791044776119,
+      "eval_loss": 0.47916167974472046,
       "eval_macro avg": {
+        "f1-score": 0.8140269855279986,
+        "precision": 0.812129988800381,
+        "recall": 0.8168227833133802,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4308,
+      "eval_samples_per_second": 56.613,
+      "eval_steps_per_second": 7.688,
       "eval_weighted avg": {
+        "f1-score": 0.8515914362320791,
+        "precision": 0.8515881419840463,
+        "recall": 0.8521791044776119,
+        "support": 33500.0
       },
       "step": 246
     },
     {
       "epoch": 7.0,
       "eval_Claim": {
+        "f1-score": 0.5961820851688694,
+        "precision": 0.6744186046511628,
+        "recall": 0.5342105263157895,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8332962385933673,
+        "precision": 0.8121475054229935,
+        "recall": 0.8555758683729433,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9087219135056778,
+        "precision": 0.9198786930150655,
+        "recall": 0.8978325217225246,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.8884371491853515,
+        "precision": 0.8582063305978898,
+        "recall": 0.9208755267626895,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8523880597014926,
+      "eval_loss": 0.5201511383056641,
       "eval_macro avg": {
+        "f1-score": 0.8066593466133165,
+        "precision": 0.816162783421778,
+        "recall": 0.8021236107934867,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.436,
+      "eval_samples_per_second": 56.406,
+      "eval_steps_per_second": 7.66,
       "eval_weighted avg": {
+        "f1-score": 0.8480805524125185,
+        "precision": 0.8473766761482054,
+        "recall": 0.8523880597014926,
+        "support": 33500.0
       },
       "step": 287
     },
     {
       "epoch": 8.0,
       "eval_Claim": {
+        "f1-score": 0.6418997361477573,
+        "precision": 0.6705622932745314,
+        "recall": 0.6155870445344129,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8422907488986784,
+        "precision": 0.8129251700680272,
+        "recall": 0.8738574040219378,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.909046716251033,
+        "precision": 0.9259259259259259,
+        "recall": 0.89277188962093,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.8894304929968533,
+        "precision": 0.8728428701180745,
+        "recall": 0.9066607962764954,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8572537313432835,
+      "eval_loss": 0.5458493232727051,
       "eval_macro avg": {
+        "f1-score": 0.8206669235735804,
+        "precision": 0.8205640648466398,
+        "recall": 0.822219283613444,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4343,
+      "eval_samples_per_second": 56.474,
+      "eval_steps_per_second": 7.669,
       "eval_weighted avg": {
+        "f1-score": 0.8559826424660975,
+        "precision": 0.8556957914959558,
+        "recall": 0.8572537313432835,
+        "support": 33500.0
       },
       "step": 328
     },
     {
       "epoch": 9.0,
       "eval_Claim": {
+        "f1-score": 0.6331998768093625,
+        "precision": 0.6423661737138097,
+        "recall": 0.6242914979757085,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8381555153707052,
+        "precision": 0.8291592128801432,
+        "recall": 0.8473491773308958,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9061017111633034,
+        "precision": 0.909720885466795,
+        "recall": 0.9025112193258856,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.8844614037282621,
+        "precision": 0.8796739874323399,
+        "recall": 0.8893012139128247,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8516119402985075,
+      "eval_loss": 0.5549963116645813,
       "eval_macro avg": {
+        "f1-score": 0.8154796267679083,
+        "precision": 0.8152300648732719,
+        "recall": 0.8158632771363286,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4235,
+      "eval_samples_per_second": 56.902,
+      "eval_steps_per_second": 7.727,
       "eval_weighted avg": {
+        "f1-score": 0.8511506488942767,
+        "precision": 0.8507741138987609,
+        "recall": 0.8516119402985075,
+        "support": 33500.0
       },
       "step": 369
     },
     {
       "epoch": 10.0,
       "eval_Claim": {
+        "f1-score": 0.6263982102908278,
+        "precision": 0.6611198560827524,
+        "recall": 0.5951417004048583,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8409399005874378,
+        "precision": 0.8315460232350312,
+        "recall": 0.8505484460694699,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9098583349505143,
+        "precision": 0.9248446592366111,
+        "recall": 0.8953499474840065,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.8851573292402148,
+        "precision": 0.8645358599184456,
+        "recall": 0.9067865903515945,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8535820895522388,
+      "eval_loss": 0.5788276791572571,
       "eval_macro avg": {
+        "f1-score": 0.8155884437672487,
+        "precision": 0.8205115996182102,
+        "recall": 0.8119566710774824,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4232,
+      "eval_samples_per_second": 56.912,
+      "eval_steps_per_second": 7.729,
       "eval_weighted avg": {
+        "f1-score": 0.8518342203238483,
+        "precision": 0.851239060922849,
+        "recall": 0.8535820895522388,
+        "support": 33500.0
       },
       "step": 410
     },
     {
       "epoch": 11.0,
       "eval_Claim": {
+        "f1-score": 0.6328578975171685,
+        "precision": 0.661878453038674,
+        "recall": 0.6062753036437247,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8469798657718122,
+        "precision": 0.829535495179667,
+        "recall": 0.8651736745886655,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9110819097678493,
+        "precision": 0.9291244788564622,
+        "recall": 0.8937267258665139,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.88966111076942,
+        "precision": 0.8703893134364282,
+        "recall": 0.9098056481539719,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8571044776119403,
+      "eval_loss": 0.5865030288696289,
       "eval_macro avg": {
+        "f1-score": 0.8201451959565625,
+        "precision": 0.8227319351278078,
+        "recall": 0.818745338063219,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4299,
+      "eval_samples_per_second": 56.648,
+      "eval_steps_per_second": 7.693,
       "eval_weighted avg": {
+        "f1-score": 0.8557012776467233,
+        "precision": 0.8553356293389153,
+        "recall": 0.8571044776119403,
+        "support": 33500.0
       },
       "step": 451
     },
     {
       "epoch": 12.0,
       "eval_Claim": {
+        "f1-score": 0.6447044940505456,
+        "precision": 0.6268885064065787,
+        "recall": 0.6635627530364372,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8387389430709912,
+        "precision": 0.8325078793336335,
+        "recall": 0.8450639853747715,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9096724171351037,
+        "precision": 0.923546196989078,
+        "recall": 0.896209300105032,
+        "support": 10473.0
       },
       "eval_Premise": {
+        "f1-score": 0.885106650726735,
+        "precision": 0.885440926543715,
+        "recall": 0.8847726272092584,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8531343283582089,
+      "eval_loss": 0.6139675378799438,
       "eval_macro avg": {
+        "f1-score": 0.8195556262458439,
+        "precision": 0.8170958773182513,
+        "recall": 0.8224021664313748,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4276,
+      "eval_samples_per_second": 56.739,
+      "eval_steps_per_second": 7.705,
       "eval_weighted avg": {
+        "f1-score": 0.8543077872420695,
+        "precision": 0.8557695842930038,
+        "recall": 0.8531343283582089,
+        "support": 33500.0
       },
       "step": 492
     }
   "num_input_tokens_seen": 0,
   "num_train_epochs": 16,
   "save_steps": 500,
+  "total_flos": 1720106206408800.0,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

checkpoint-492/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fdcb45ede21ecca936ab63090715c5dc953e544931a449f7e44cc1bbcab87ad8
 size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:a34106aa46561666831adcdfa68f4d8530a86618e19859d53733fffd662fa99f
 size 4664