henryscheible
/

bert-large-uncased_winobias_finetuned

@@ -16,12 +16,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [bert-large-uncased](https://huggingface.co/bert-large-uncased) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.6933
-- Accuracy: 0.5
-- Tp: 0.0
-- Tn: 0.5
-- Fp: 0.0
-- Fn: 0.5
 ## Model description
@@ -40,80 +36,57 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0001
-- train_batch_size: 64
 - eval_batch_size: 64
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 50
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Accuracy | Tp  | Tn  | Fp  | Fn  |
-|:-------------:|:-----:|:----:|:---------------:|:--------:|:---:|:---:|:---:|:---:|
-| 0.7205        | 0.8   | 20   | 0.7006          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7147        | 1.6   | 40   | 0.6985          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.6975        | 2.4   | 60   | 0.6935          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7205        | 3.2   | 80   | 0.7013          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7022        | 4.0   | 100  | 0.6932          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7095        | 4.8   | 120  | 0.6952          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7059        | 5.6   | 140  | 0.7019          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.718         | 6.4   | 160  | 0.6988          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7053        | 7.2   | 180  | 0.7102          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7096        | 8.0   | 200  | 0.6936          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7041        | 8.8   | 220  | 0.6939          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.6954        | 9.6   | 240  | 0.6952          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7084        | 10.4  | 260  | 0.6982          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7056        | 11.2  | 280  | 0.6937          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7012        | 12.0  | 300  | 0.7026          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7159        | 12.8  | 320  | 0.6942          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7059        | 13.6  | 340  | 0.6933          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.6999        | 14.4  | 360  | 0.6938          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7091        | 15.2  | 380  | 0.6951          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7           | 16.0  | 400  | 0.6932          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7048        | 16.8  | 420  | 0.6946          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.703         | 17.6  | 440  | 0.6976          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.711         | 18.4  | 460  | 0.6983          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7066        | 19.2  | 480  | 0.6997          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7109        | 20.0  | 500  | 0.6934          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.6969        | 20.8  | 520  | 0.7001          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7026        | 21.6  | 540  | 0.6941          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7           | 22.4  | 560  | 0.6946          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7003        | 23.2  | 580  | 0.6977          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7154        | 24.0  | 600  | 0.6932          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.6976        | 24.8  | 620  | 0.6938          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7117        | 25.6  | 640  | 0.6944          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7023        | 26.4  | 660  | 0.6934          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7039        | 27.2  | 680  | 0.6932          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7053        | 28.0  | 700  | 0.6950          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7001        | 28.8  | 720  | 0.6941          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7026        | 29.6  | 740  | 0.6935          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7007        | 30.4  | 760  | 0.6932          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7058        | 31.2  | 780  | 0.6933          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.6995        | 32.0  | 800  | 0.6940          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7053        | 32.8  | 820  | 0.6939          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7066        | 33.6  | 840  | 0.6932          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7019        | 34.4  | 860  | 0.6932          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7062        | 35.2  | 880  | 0.6952          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7061        | 36.0  | 900  | 0.6941          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7115        | 36.8  | 920  | 0.6933          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7025        | 37.6  | 940  | 0.6953          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.6974        | 38.4  | 960  | 0.6936          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7077        | 39.2  | 980  | 0.6932          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7038        | 40.0  | 1000 | 0.6932          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.6995        | 40.8  | 1020 | 0.6932          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.701         | 41.6  | 1040 | 0.6932          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.6972        | 42.4  | 1060 | 0.6934          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7038        | 43.2  | 1080 | 0.6936          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7047        | 44.0  | 1100 | 0.6934          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.7087        | 44.8  | 1120 | 0.6932          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7082        | 45.6  | 1140 | 0.6932          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.7023        | 46.4  | 1160 | 0.6934          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.6987        | 47.2  | 1180 | 0.6933          | 0.5      | 0.5 | 0.0 | 0.5 | 0.0 |
-| 0.6999        | 48.0  | 1200 | 0.6931          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.701         | 48.8  | 1220 | 0.6932          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
-| 0.6995        | 49.6  | 1240 | 0.6933          | 0.5      | 0.0 | 0.5 | 0.0 | 0.5 |
 ### Framework versions

 This model is a fine-tuned version of [bert-large-uncased](https://huggingface.co/bert-large-uncased) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4783
+- Accuracy: 0.7986
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 1e-05
+- train_batch_size: 128
 - eval_batch_size: 64
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 15
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| No log        | 0.38  | 5    | 0.7011          | 0.4994   |
+| No log        | 0.77  | 10   | 0.6942          | 0.4987   |
+| No log        | 1.15  | 15   | 0.6941          | 0.5063   |
+| No log        | 1.54  | 20   | 0.6936          | 0.4924   |
+| No log        | 1.92  | 25   | 0.6928          | 0.5114   |
+| No log        | 2.31  | 30   | 0.6925          | 0.5196   |
+| No log        | 2.69  | 35   | 0.6925          | 0.5215   |
+| No log        | 3.08  | 40   | 0.6923          | 0.5227   |
+| No log        | 3.46  | 45   | 0.6922          | 0.5259   |
+| No log        | 3.85  | 50   | 0.6922          | 0.5202   |
+| No log        | 4.23  | 55   | 0.6918          | 0.5316   |
+| No log        | 4.62  | 60   | 0.6912          | 0.5499   |
+| No log        | 5.0   | 65   | 0.6904          | 0.5574   |
+| No log        | 5.38  | 70   | 0.6899          | 0.5492   |
+| No log        | 5.77  | 75   | 0.6894          | 0.5417   |
+| No log        | 6.15  | 80   | 0.6890          | 0.5290   |
+| No log        | 6.54  | 85   | 0.6883          | 0.5366   |
+| No log        | 6.92  | 90   | 0.6863          | 0.5726   |
+| No log        | 7.31  | 95   | 0.6837          | 0.5909   |
+| No log        | 7.69  | 100  | 0.6812          | 0.5890   |
+| No log        | 8.08  | 105  | 0.6788          | 0.5915   |
+| No log        | 8.46  | 110  | 0.6738          | 0.6225   |
+| No log        | 8.85  | 115  | 0.6685          | 0.6503   |
+| No log        | 9.23  | 120  | 0.6616          | 0.6698   |
+| No log        | 9.62  | 125  | 0.6533          | 0.6799   |
+| No log        | 10.0  | 130  | 0.6403          | 0.7027   |
+| No log        | 10.38 | 135  | 0.6282          | 0.7077   |
+| No log        | 10.77 | 140  | 0.6142          | 0.7235   |
+| No log        | 11.15 | 145  | 0.5967          | 0.7355   |
+| No log        | 11.54 | 150  | 0.5814          | 0.7437   |
+| No log        | 11.92 | 155  | 0.5662          | 0.7513   |
+| No log        | 12.31 | 160  | 0.5454          | 0.7607   |
+| No log        | 12.69 | 165  | 0.5251          | 0.7771   |
+| No log        | 13.08 | 170  | 0.5091          | 0.7872   |
+| No log        | 13.46 | 175  | 0.4975          | 0.7942   |
+| No log        | 13.85 | 180  | 0.4892          | 0.7967   |
+| No log        | 14.23 | 185  | 0.4832          | 0.7992   |
+| No log        | 14.62 | 190  | 0.4797          | 0.8005   |
+| No log        | 15.0  | 195  | 0.4783          | 0.7986   |
 ### Framework versions

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2c17dc0f170656d33d54ef1274f6edbfc2cca2a723bb23d139fb7f936b9bcb37
 size 1340714613

 version https://git-lfs.github.com/spec/v1
+oid sha256:964f400ea7dec1a3b0cfb382d401bb0b9fcb57945bd02e811849d5eae34ce86a
 size 1340714613

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3482324b6d141994957c64d9984d50c4aacfd13b778fc88d7605ee89b2a578c3
 size 3515

 version https://git-lfs.github.com/spec/v1
+oid sha256:4e22720a57ff1706e69bbda9b52a864205ed403d4e3fd366dce8bbecb9fdf1d6
 size 3515