joshcarp
/

gpt2-evy

@@ -1,8 +1,8 @@
 ---
 license: mit
 tags:
 - generated_from_trainer
-base_model: gpt2
 model-index:
 - name: gpt2-evy
   results: []
@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.2879
 ## Model description
@@ -46,19 +46,34 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| No log        | 1.0   | 48   | 1.4347          |
-| No log        | 2.0   | 96   | 1.2810          |
-| 1.3199        | 3.0   | 144  | 1.2442          |
-| 1.3199        | 4.0   | 192  | 1.2476          |
-| 0.879         | 5.0   | 240  | 1.2303          |
-| 0.879         | 6.0   | 288  | 1.2328          |
-| 0.7449        | 7.0   | 336  | 1.2577          |
-| 0.7449        | 8.0   | 384  | 1.2879          |
 ### Framework versions
-- Transformers 4.40.2
-- Pytorch 2.2.1+cu121
 - Datasets 2.19.1
 - Tokenizers 0.19.1

 ---
 license: mit
+base_model: gpt2
 tags:
 - generated_from_trainer
 model-index:
 - name: gpt2-evy
   results: []
 This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.5637
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| No log        | 1.0   | 31   | 1.1270          |
+| No log        | 2.0   | 62   | 0.9170          |
+| No log        | 3.0   | 93   | 0.8410          |
+| 1.3727        | 4.0   | 124  | 0.7949          |
+| 1.3727        | 5.0   | 155  | 0.7361          |
+| 1.3727        | 6.0   | 186  | 0.7021          |
+| 0.9077        | 7.0   | 217  | 0.6789          |
+| 0.9077        | 8.0   | 248  | 0.6490          |
+| 0.9077        | 9.0   | 279  | 0.6346          |
+| 0.7106        | 10.0  | 310  | 0.6219          |
+| 0.7106        | 11.0  | 341  | 0.5986          |
+| 0.7106        | 12.0  | 372  | 0.5797          |
+| 0.5814        | 13.0  | 403  | 0.5835          |
+| 0.5814        | 14.0  | 434  | 0.5872          |
+| 0.5814        | 15.0  | 465  | 0.5741          |
+| 0.5814        | 16.0  | 496  | 0.5749          |
+| 0.4916        | 17.0  | 527  | 0.5662          |
+| 0.4916        | 18.0  | 558  | 0.5529          |
+| 0.4916        | 19.0  | 589  | 0.5672          |
+| 0.4005        | 20.0  | 620  | 0.5646          |
+| 0.4005        | 21.0  | 651  | 0.5701          |
+| 0.4005        | 22.0  | 682  | 0.5650          |
+| 0.357         | 23.0  | 713  | 0.5637          |
 ### Framework versions
+- Transformers 4.41.0
+- Pytorch 2.3.0+cu121
 - Datasets 2.19.1
 - Tokenizers 0.19.1

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
-  "transformers_version": "4.40.2"
 }

   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
+  "transformers_version": "4.41.0"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e206e896c82a075a90bf2f86649f9387e71855d3224a755c0e77e107618921cc
 size 497774208

 version https://git-lfs.github.com/spec/v1
+oid sha256:d5c0e35f2d813737a44ac311005bc894f3066454328f76553174304565eb1471
 size 497774208