Training in progress, epoch 12, checkpoint

Browse files

Files changed (5) hide show

checkpoint-492/model.safetensors +1 -1
checkpoint-492/optimizer.pt +1 -1
checkpoint-492/rng_state.pth +1 -1
checkpoint-492/trainer_state.json +361 -361
checkpoint-492/training_args.bin +1 -1

checkpoint-492/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bc431db88957a585280816f57e4b96ae38f064c384dba8a731417633aacd382a
 size 592324828

 version https://git-lfs.github.com/spec/v1
+oid sha256:a69e6ea5750d150ff1dd4ce0fc02f96f3acc47be838d2c909f35f2ad669195b9
 size 592324828

checkpoint-492/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:792abab89fd6bbc2028f41f1dd932b0921994ca64b5791503fe505df9851ab7a
 size 1014657786

 version https://git-lfs.github.com/spec/v1
+oid sha256:fbe87b27ef7dc6558599788bf7c725a37cd83a22683b28b897ec393311785eef
 size 1014657786

checkpoint-492/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b6e53e706c63ba0c275c9b6332ceadb76c337b40858f3ddadb0ab10622a334eb
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:1c189466643703424c77db24cb1c70bb1b76b65752ddeeaa3d7bb424b6ea3dcb
 size 14244

checkpoint-492/trainer_state.json CHANGED Viewed

@@ -11,540 +11,540 @@
     {
       "epoch": 1.0,
       "eval_Claim": {
-        "f1-score": 0.3926645091693635,
-        "precision": 0.4813399941228328,
-        "recall": 0.33157894736842103,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.5305101700566855,
-        "precision": 0.41758530183727033,
-        "recall": 0.7271480804387569,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.8568685802054334,
-        "precision": 0.8614998552263295,
-        "recall": 0.8522868328081734,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.8535428122545169,
-        "precision": 0.8528192892126083,
-        "recall": 0.8542675639977357,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.7682686567164179,
-      "eval_loss": 0.6236585974693298,
       "eval_macro avg": {
-        "f1-score": 0.6583965179214999,
-        "precision": 0.6533111100997602,
-        "recall": 0.6913203561532717,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4247,
-      "eval_samples_per_second": 56.854,
-      "eval_steps_per_second": 7.721,
       "eval_weighted avg": {
-        "f1-score": 0.7655218131315448,
-        "precision": 0.7723271066974134,
-        "recall": 0.7682686567164179,
-        "support": 33500.0
       },
       "step": 41
     },
     {
       "epoch": 2.0,
       "eval_Claim": {
-        "f1-score": 0.5235859602056785,
-        "precision": 0.5846230654018971,
-        "recall": 0.47408906882591095,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.7206085753803596,
-        "precision": 0.7269767441860465,
-        "recall": 0.7143510054844607,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.8884743765953269,
-        "precision": 0.9142337609859582,
-        "recall": 0.8641268022534135,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.8745201535508637,
-        "precision": 0.8357695614789338,
-        "recall": 0.917038807472168,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8219402985074626,
-      "eval_loss": 0.47505903244018555,
       "eval_macro avg": {
-        "f1-score": 0.7517972664330571,
-        "precision": 0.7654007830132088,
-        "recall": 0.7424014210089883,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4322,
-      "eval_samples_per_second": 56.557,
-      "eval_steps_per_second": 7.681,
       "eval_weighted avg": {
-        "f1-score": 0.8170804260816812,
-        "precision": 0.816159208839521,
-        "recall": 0.8219402985074626,
-        "support": 33500.0
       },
       "step": 82
     },
     {
       "epoch": 3.0,
       "eval_Claim": {
-        "f1-score": 0.5033996474439688,
-        "precision": 0.6658894070619586,
-        "recall": 0.4046558704453441,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.7934708682838358,
-        "precision": 0.7872244714349977,
-        "recall": 0.79981718464351,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.9017883608339096,
-        "precision": 0.9342819121711536,
-        "recall": 0.8714790413444095,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.8787676209853219,
-        "precision": 0.8168702042580784,
-        "recall": 0.9508145166362665,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8356119402985075,
-      "eval_loss": 0.458564430475235,
       "eval_macro avg": {
-        "f1-score": 0.7693566243867591,
-        "precision": 0.8010664987315472,
-        "recall": 0.7566916532673825,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4302,
-      "eval_samples_per_second": 56.636,
-      "eval_steps_per_second": 7.691,
       "eval_weighted avg": {
-        "f1-score": 0.8250407291712659,
-        "precision": 0.8293759599418965,
-        "recall": 0.8356119402985075,
-        "support": 33500.0
       },
       "step": 123
     },
     {
       "epoch": 4.0,
       "eval_Claim": {
-        "f1-score": 0.6119839240043845,
-        "precision": 0.5575898801597869,
-        "recall": 0.6781376518218624,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8013553578991952,
-        "precision": 0.7466456195737964,
-        "recall": 0.8647166361974405,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.9009650063359004,
-        "precision": 0.9201592832254853,
-        "recall": 0.8825551417931825,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.8636894716344281,
-        "precision": 0.8922416683430564,
-        "recall": 0.836907981634065,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8295820895522388,
-      "eval_loss": 0.45249882340431213,
       "eval_macro avg": {
-        "f1-score": 0.7944984399684771,
-        "precision": 0.7791591128255312,
-        "recall": 0.8155793528616375,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4313,
-      "eval_samples_per_second": 56.59,
-      "eval_steps_per_second": 7.685,
       "eval_weighted avg": {
-        "f1-score": 0.8341543739861718,
-        "precision": 0.8421114352783158,
-        "recall": 0.8295820895522388,
-        "support": 33500.0
       },
       "step": 164
     },
     {
       "epoch": 5.0,
       "eval_Claim": {
-        "f1-score": 0.6177297297297297,
-        "precision": 0.662877030162413,
-        "recall": 0.5783400809716599,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8327169893408746,
-        "precision": 0.7945205479452054,
-        "recall": 0.8747714808043876,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.9074411905904946,
-        "precision": 0.9125229313507772,
-        "recall": 0.9024157357013273,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.8867988738669058,
-        "precision": 0.8726254262055528,
-        "recall": 0.9014403421598842,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8523582089552239,
-      "eval_loss": 0.47209030389785767,
       "eval_macro avg": {
-        "f1-score": 0.8111716958820011,
-        "precision": 0.8106364839159872,
-        "recall": 0.8142419099093148,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4276,
-      "eval_samples_per_second": 56.738,
-      "eval_steps_per_second": 7.705,
       "eval_weighted avg": {
-        "f1-score": 0.8500422842449816,
-        "precision": 0.8490670984831405,
-        "recall": 0.8523582089552239,
-        "support": 33500.0
       },
       "step": 205
     },
     {
       "epoch": 6.0,
       "eval_Claim": {
-        "f1-score": 0.6278612118073537,
-        "precision": 0.6428419936373276,
-        "recall": 0.6135627530364373,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.83248730964467,
-        "precision": 0.804950917626974,
-        "recall": 0.8619744058500914,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.9114601059950406,
-        "precision": 0.9285714285714286,
-        "recall": 0.8949680129857729,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.8842993146649301,
-        "precision": 0.872155615365794,
-        "recall": 0.8967859613812189,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8521791044776119,
-      "eval_loss": 0.47916167974472046,
       "eval_macro avg": {
-        "f1-score": 0.8140269855279986,
-        "precision": 0.812129988800381,
-        "recall": 0.8168227833133802,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4308,
-      "eval_samples_per_second": 56.613,
-      "eval_steps_per_second": 7.688,
       "eval_weighted avg": {
-        "f1-score": 0.8515914362320791,
-        "precision": 0.8515881419840463,
-        "recall": 0.8521791044776119,
-        "support": 33500.0
       },
       "step": 246
     },
     {
       "epoch": 7.0,
       "eval_Claim": {
-        "f1-score": 0.5961820851688694,
-        "precision": 0.6744186046511628,
-        "recall": 0.5342105263157895,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8332962385933673,
-        "precision": 0.8121475054229935,
-        "recall": 0.8555758683729433,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.9087219135056778,
-        "precision": 0.9198786930150655,
-        "recall": 0.8978325217225246,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.8884371491853515,
-        "precision": 0.8582063305978898,
-        "recall": 0.9208755267626895,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8523880597014926,
-      "eval_loss": 0.5201511383056641,
       "eval_macro avg": {
-        "f1-score": 0.8066593466133165,
-        "precision": 0.816162783421778,
-        "recall": 0.8021236107934867,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.436,
-      "eval_samples_per_second": 56.406,
-      "eval_steps_per_second": 7.66,
       "eval_weighted avg": {
-        "f1-score": 0.8480805524125185,
-        "precision": 0.8473766761482054,
-        "recall": 0.8523880597014926,
-        "support": 33500.0
       },
       "step": 287
     },
     {
       "epoch": 8.0,
       "eval_Claim": {
-        "f1-score": 0.6418997361477573,
-        "precision": 0.6705622932745314,
-        "recall": 0.6155870445344129,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8422907488986784,
-        "precision": 0.8129251700680272,
-        "recall": 0.8738574040219378,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.909046716251033,
-        "precision": 0.9259259259259259,
-        "recall": 0.89277188962093,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.8894304929968533,
-        "precision": 0.8728428701180745,
-        "recall": 0.9066607962764954,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8572537313432835,
-      "eval_loss": 0.5458493232727051,
       "eval_macro avg": {
-        "f1-score": 0.8206669235735804,
-        "precision": 0.8205640648466398,
-        "recall": 0.822219283613444,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4343,
-      "eval_samples_per_second": 56.474,
-      "eval_steps_per_second": 7.669,
       "eval_weighted avg": {
-        "f1-score": 0.8559826424660975,
-        "precision": 0.8556957914959558,
-        "recall": 0.8572537313432835,
-        "support": 33500.0
       },
       "step": 328
     },
     {
       "epoch": 9.0,
       "eval_Claim": {
-        "f1-score": 0.6331998768093625,
-        "precision": 0.6423661737138097,
-        "recall": 0.6242914979757085,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8381555153707052,
-        "precision": 0.8291592128801432,
-        "recall": 0.8473491773308958,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.9061017111633034,
-        "precision": 0.909720885466795,
-        "recall": 0.9025112193258856,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.8844614037282621,
-        "precision": 0.8796739874323399,
-        "recall": 0.8893012139128247,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8516119402985075,
-      "eval_loss": 0.5549963116645813,
       "eval_macro avg": {
-        "f1-score": 0.8154796267679083,
-        "precision": 0.8152300648732719,
-        "recall": 0.8158632771363286,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4235,
-      "eval_samples_per_second": 56.902,
-      "eval_steps_per_second": 7.727,
       "eval_weighted avg": {
-        "f1-score": 0.8511506488942767,
-        "precision": 0.8507741138987609,
-        "recall": 0.8516119402985075,
-        "support": 33500.0
       },
       "step": 369
     },
     {
       "epoch": 10.0,
       "eval_Claim": {
-        "f1-score": 0.6263982102908278,
-        "precision": 0.6611198560827524,
-        "recall": 0.5951417004048583,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8409399005874378,
-        "precision": 0.8315460232350312,
-        "recall": 0.8505484460694699,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.9098583349505143,
-        "precision": 0.9248446592366111,
-        "recall": 0.8953499474840065,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.8851573292402148,
-        "precision": 0.8645358599184456,
-        "recall": 0.9067865903515945,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8535820895522388,
-      "eval_loss": 0.5788276791572571,
       "eval_macro avg": {
-        "f1-score": 0.8155884437672487,
-        "precision": 0.8205115996182102,
-        "recall": 0.8119566710774824,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4232,
-      "eval_samples_per_second": 56.912,
-      "eval_steps_per_second": 7.729,
       "eval_weighted avg": {
-        "f1-score": 0.8518342203238483,
-        "precision": 0.851239060922849,
-        "recall": 0.8535820895522388,
-        "support": 33500.0
       },
       "step": 410
     },
     {
       "epoch": 11.0,
       "eval_Claim": {
-        "f1-score": 0.6328578975171685,
-        "precision": 0.661878453038674,
-        "recall": 0.6062753036437247,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8469798657718122,
-        "precision": 0.829535495179667,
-        "recall": 0.8651736745886655,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.9110819097678493,
-        "precision": 0.9291244788564622,
-        "recall": 0.8937267258665139,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.88966111076942,
-        "precision": 0.8703893134364282,
-        "recall": 0.9098056481539719,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8571044776119403,
-      "eval_loss": 0.5865030288696289,
       "eval_macro avg": {
-        "f1-score": 0.8201451959565625,
-        "precision": 0.8227319351278078,
-        "recall": 0.818745338063219,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4299,
-      "eval_samples_per_second": 56.648,
-      "eval_steps_per_second": 7.693,
       "eval_weighted avg": {
-        "f1-score": 0.8557012776467233,
-        "precision": 0.8553356293389153,
-        "recall": 0.8571044776119403,
-        "support": 33500.0
       },
       "step": 451
     },
     {
       "epoch": 12.0,
       "eval_Claim": {
-        "f1-score": 0.6447044940505456,
-        "precision": 0.6268885064065787,
-        "recall": 0.6635627530364372,
-        "support": 4940.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8387389430709912,
-        "precision": 0.8325078793336335,
-        "recall": 0.8450639853747715,
-        "support": 2188.0
       },
       "eval_O": {
-        "f1-score": 0.9096724171351037,
-        "precision": 0.923546196989078,
-        "recall": 0.896209300105032,
-        "support": 10473.0
       },
       "eval_Premise": {
-        "f1-score": 0.885106650726735,
-        "precision": 0.885440926543715,
-        "recall": 0.8847726272092584,
-        "support": 15899.0
       },
-      "eval_accuracy": 0.8531343283582089,
-      "eval_loss": 0.6139675378799438,
       "eval_macro avg": {
-        "f1-score": 0.8195556262458439,
-        "precision": 0.8170958773182513,
-        "recall": 0.8224021664313748,
-        "support": 33500.0
-      },
-      "eval_runtime": 1.4276,
-      "eval_samples_per_second": 56.739,
-      "eval_steps_per_second": 7.705,
       "eval_weighted avg": {
-        "f1-score": 0.8543077872420695,
-        "precision": 0.8557695842930038,
-        "recall": 0.8531343283582089,
-        "support": 33500.0
       },
       "step": 492
     }
@@ -554,7 +554,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 16,
   "save_steps": 500,
-  "total_flos": 1720106206408800.0,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

     {
       "epoch": 1.0,
       "eval_Claim": {
+        "f1-score": 0.31881702957426067,
+        "precision": 0.49395770392749244,
+        "recall": 0.23536468330134358,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.5882107894188711,
+        "precision": 0.5330313325783315,
+        "recall": 0.6561338289962825,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.8686845568461407,
+        "precision": 0.9200096957944491,
+        "recall": 0.82278343810969,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8547340147728121,
+        "precision": 0.777574153261386,
+        "recall": 0.9488942267870455,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.7762772004779318,
+      "eval_loss": 0.5690305829048157,
       "eval_macro avg": {
+        "f1-score": 0.6576115976530211,
+        "precision": 0.6811432213904147,
+        "recall": 0.6657940442985903,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3776,
+      "eval_samples_per_second": 58.074,
+      "eval_steps_per_second": 7.259,
       "eval_weighted avg": {
+        "f1-score": 0.7577517824653167,
+        "precision": 0.7632992267425562,
+        "recall": 0.7762772004779318,
+        "support": 27619.0
       },
       "step": 41
     },
     {
       "epoch": 2.0,
       "eval_Claim": {
+        "f1-score": 0.5093288777499304,
+        "precision": 0.6068347710683477,
+        "recall": 0.43881957773512476,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7403386886669561,
+        "precision": 0.6947840260798696,
+        "recall": 0.7922862453531598,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.8998096943915818,
+        "precision": 0.930324074074074,
+        "recall": 0.8712334706264904,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8735146966854284,
+        "precision": 0.8270298275479239,
+        "recall": 0.9255363207156465,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.823563488902567,
+      "eval_loss": 0.44297581911087036,
       "eval_macro avg": {
+        "f1-score": 0.7557479893734742,
+        "precision": 0.7647431746925538,
+        "recall": 0.7569689036076054,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3774,
+      "eval_samples_per_second": 58.08,
+      "eval_steps_per_second": 7.26,
       "eval_weighted avg": {
+        "f1-score": 0.8169621924766614,
+        "precision": 0.8180007808150275,
+        "recall": 0.823563488902567,
+        "support": 27619.0
       },
       "step": 82
     },
     {
       "epoch": 3.0,
       "eval_Claim": {
+        "f1-score": 0.6003528892809882,
+        "precision": 0.5555102040816327,
+        "recall": 0.6530710172744721,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7456098718557191,
+        "precision": 0.7618816682832201,
+        "recall": 0.7300185873605948,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.9073143179892686,
+        "precision": 0.9472815190470575,
+        "recall": 0.8705831346195534,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8768298214506619,
+        "precision": 0.8730497618656594,
+        "recall": 0.8806427565642343,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.8312031572468228,
+      "eval_loss": 0.42804914712905884,
       "eval_macro avg": {
+        "f1-score": 0.7825267251441594,
+        "precision": 0.7844307883193924,
+        "recall": 0.7835788739547136,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3753,
+      "eval_samples_per_second": 58.17,
+      "eval_steps_per_second": 7.271,
       "eval_weighted avg": {
+        "f1-score": 0.8350654121763821,
+        "precision": 0.8412645262496828,
+        "recall": 0.8312031572468228,
+        "support": 27619.0
       },
       "step": 123
     },
     {
       "epoch": 4.0,
       "eval_Claim": {
+        "f1-score": 0.5695364238410595,
+        "precision": 0.6521200866604766,
+        "recall": 0.5055182341650671,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7937086847503988,
+        "precision": 0.7789709172259508,
+        "recall": 0.8090148698884758,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.9155632732797916,
+        "precision": 0.91675722668985,
+        "recall": 0.9143724257533059,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8839514066496164,
+        "precision": 0.85398810902633,
+        "recall": 0.9160937629421022,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.8452152503711213,
+      "eval_loss": 0.4198084771633148,
       "eval_macro avg": {
+        "f1-score": 0.7906899471302166,
+        "precision": 0.8004590849006519,
+        "recall": 0.7862498231872379,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3806,
+      "eval_samples_per_second": 57.945,
+      "eval_steps_per_second": 7.243,
       "eval_weighted avg": {
+        "f1-score": 0.8400311740436862,
+        "precision": 0.8386466761572305,
+        "recall": 0.8452152503711213,
+        "support": 27619.0
       },
       "step": 164
     },
     {
       "epoch": 5.0,
       "eval_Claim": {
+        "f1-score": 0.6163734776725303,
+        "precision": 0.5814893617021276,
+        "recall": 0.6557101727447217,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7828498293515358,
+        "precision": 0.7235804416403786,
+        "recall": 0.8526951672862454,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.9165979438121942,
+        "precision": 0.9300457436126297,
+        "recall": 0.9035334923043572,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8766015408845188,
+        "precision": 0.9016637478108581,
+        "recall": 0.8528948894226787,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.8400376552373366,
+      "eval_loss": 0.44705528020858765,
       "eval_macro avg": {
+        "f1-score": 0.7981056979301948,
+        "precision": 0.7841948236914985,
+        "recall": 0.8162084304395008,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3758,
+      "eval_samples_per_second": 58.148,
+      "eval_steps_per_second": 7.268,
       "eval_weighted avg": {
+        "f1-score": 0.843386093646175,
+        "precision": 0.8489511288560475,
+        "recall": 0.8400376552373366,
+        "support": 27619.0
       },
       "step": 205
     },
     {
       "epoch": 6.0,
       "eval_Claim": {
+        "f1-score": 0.6241953385127637,
+        "precision": 0.5807517554729451,
+        "recall": 0.6746641074856046,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7921387283236995,
+        "precision": 0.7883110906580764,
+        "recall": 0.796003717472119,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.9180380767989674,
+        "precision": 0.9110802732707088,
+        "recall": 0.925102969867765,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8717662705392766,
+        "precision": 0.9042363830544677,
+        "recall": 0.8415472542035948,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.8407255874579094,
+      "eval_loss": 0.4595077633857727,
       "eval_macro avg": {
+        "f1-score": 0.8015346035436768,
+        "precision": 0.7960948756140495,
+        "recall": 0.8093295122572709,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3748,
+      "eval_samples_per_second": 58.192,
+      "eval_steps_per_second": 7.274,
       "eval_weighted avg": {
+        "f1-score": 0.8436577064716956,
+        "precision": 0.8486726976979458,
+        "recall": 0.8407255874579094,
+        "support": 27619.0
       },
       "step": 246
     },
     {
       "epoch": 7.0,
       "eval_Claim": {
+        "f1-score": 0.5836049135121585,
+        "precision": 0.6110236220472441,
+        "recall": 0.5585412667946257,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7928268050967437,
+        "precision": 0.8053691275167785,
+        "recall": 0.7806691449814126,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.9194612574295218,
+        "precision": 0.9251618566882476,
+        "recall": 0.9138304790808585,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8797147834541992,
+        "precision": 0.8609833465503569,
+        "recall": 0.8992793837488611,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.8434773163402006,
+      "eval_loss": 0.5069454908370972,
       "eval_macro avg": {
+        "f1-score": 0.7939019398731558,
+        "precision": 0.8006344882006567,
+        "recall": 0.7880800686514394,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3807,
+      "eval_samples_per_second": 57.943,
+      "eval_steps_per_second": 7.243,
       "eval_weighted avg": {
+        "f1-score": 0.8415357075120093,
+        "precision": 0.8403669956123412,
+        "recall": 0.8434773163402006,
+        "support": 27619.0
       },
       "step": 287
     },
     {
       "epoch": 8.0,
       "eval_Claim": {
+        "f1-score": 0.5933731413183467,
+        "precision": 0.5794648982391951,
+        "recall": 0.6079654510556622,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7907602601480151,
+        "precision": 0.7641959254442999,
+        "recall": 0.8192379182156134,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.9148948106591865,
+        "precision": 0.9482497964879637,
+        "recall": 0.8838066334272707,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8765821488551183,
+        "precision": 0.86709886547812,
+        "recall": 0.8862751594466992,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.8382273072884608,
+      "eval_loss": 0.548562228679657,
       "eval_macro avg": {
+        "f1-score": 0.7939025902451666,
+        "precision": 0.7897523714123946,
+        "recall": 0.7993212905363115,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3817,
+      "eval_samples_per_second": 57.901,
+      "eval_steps_per_second": 7.238,
       "eval_weighted avg": {
+        "f1-score": 0.8399540584062747,
+        "precision": 0.8427820179127555,
+        "recall": 0.8382273072884608,
+        "support": 27619.0
       },
       "step": 328
     },
     {
       "epoch": 9.0,
       "eval_Claim": {
+        "f1-score": 0.6135836554389841,
+        "precision": 0.5684468999386126,
+        "recall": 0.6665067178502879,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7970061238376048,
+        "precision": 0.7784669915817457,
+        "recall": 0.8164498141263941,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.9169912095248693,
+        "precision": 0.9420438957475995,
+        "recall": 0.893236505527856,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8721008403361344,
+        "precision": 0.8849663170461328,
+        "recall": 0.8596040752091444,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.8383359281653934,
+      "eval_loss": 0.562429666519165,
       "eval_macro avg": {
+        "f1-score": 0.7999204572843982,
+        "precision": 0.7934810260785227,
+        "recall": 0.8089492781784205,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3808,
+      "eval_samples_per_second": 57.936,
+      "eval_steps_per_second": 7.242,
       "eval_weighted avg": {
+        "f1-score": 0.8422320938058151,
+        "precision": 0.8479685351639584,
+        "recall": 0.8383359281653934,
+        "support": 27619.0
       },
       "step": 369
     },
     {
       "epoch": 10.0,
       "eval_Claim": {
+        "f1-score": 0.612128418549346,
+        "precision": 0.6067892503536068,
+        "recall": 0.6175623800383877,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7968056787932565,
+        "precision": 0.7623089983022071,
+        "recall": 0.8345724907063197,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.9155905337249902,
+        "precision": 0.9368265850062379,
+        "recall": 0.8952959028831563,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.879186060880669,
+        "precision": 0.8744673877417241,
+        "recall": 0.8839559347303901,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.8436945580940657,
+      "eval_loss": 0.5923005938529968,
       "eval_macro avg": {
+        "f1-score": 0.8009276729870654,
+        "precision": 0.795098055350944,
+        "recall": 0.8078466770895635,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3753,
+      "eval_samples_per_second": 58.169,
+      "eval_steps_per_second": 7.271,
       "eval_weighted avg": {
+        "f1-score": 0.8446261141401151,
+        "precision": 0.846163633922067,
+        "recall": 0.8436945580940657,
+        "support": 27619.0
       },
       "step": 410
     },
     {
       "epoch": 11.0,
       "eval_Claim": {
+        "f1-score": 0.6184452621895125,
+        "precision": 0.5938604240282686,
+        "recall": 0.6451535508637236,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7804655408489276,
+        "precision": 0.7668161434977578,
+        "recall": 0.7946096654275093,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.9165973031463293,
+        "precision": 0.9390562819783969,
+        "recall": 0.8951875135486668,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8779154066034218,
+        "precision": 0.8781700646444555,
+        "recall": 0.8776608962146939,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.841956624063145,
+      "eval_loss": 0.6036468148231506,
       "eval_macro avg": {
+        "f1-score": 0.7983558781970478,
+        "precision": 0.7944757285372197,
+        "recall": 0.8031529065136485,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3761,
+      "eval_samples_per_second": 58.137,
+      "eval_steps_per_second": 7.267,
       "eval_weighted avg": {
+        "f1-score": 0.8440870820617664,
+        "precision": 0.8469270804932185,
+        "recall": 0.841956624063145,
+        "support": 27619.0
       },
       "step": 451
     },
     {
       "epoch": 12.0,
       "eval_Claim": {
+        "f1-score": 0.6014948392454621,
+        "precision": 0.594930767425487,
+        "recall": 0.6082053742802304,
+        "support": 4168.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7777515908555267,
+        "precision": 0.7890961262553802,
+        "recall": 0.766728624535316,
+        "support": 2152.0
       },
       "eval_O": {
+        "f1-score": 0.9159474465394976,
+        "precision": 0.9292805354155047,
+        "recall": 0.9029915456319099,
+        "support": 9226.0
       },
       "eval_Premise": {
+        "f1-score": 0.8807384615384615,
+        "precision": 0.872541050235734,
+        "recall": 0.8890913608879317,
+        "support": 12073.0
       },
+      "eval_accuracy": 0.8418117962272349,
+      "eval_loss": 0.6291709542274475,
       "eval_macro avg": {
+        "f1-score": 0.7939830845447369,
+        "precision": 0.7964621198330264,
+        "recall": 0.791754226333847,
+        "support": 27619.0
+      },
+      "eval_runtime": 1.3752,
+      "eval_samples_per_second": 58.171,
+      "eval_steps_per_second": 7.271,
       "eval_weighted avg": {
+        "f1-score": 0.8423345704559697,
+        "precision": 0.8430984692266364,
+        "recall": 0.8418117962272349,
+        "support": 27619.0
       },
       "step": 492
     }
   "num_input_tokens_seen": 0,
   "num_train_epochs": 16,
   "save_steps": 500,
+  "total_flos": 1725464792721600.0,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

checkpoint-492/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a34106aa46561666831adcdfa68f4d8530a86618e19859d53733fffd662fa99f
 size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:a0c1709ee996939c9fcadfbefb05efc50420ff427d1c0c0c37492208bad18716
 size 4664