Model save

Browse files

Files changed (3) hide show

README.md +14 -13
runs/Oct22_03-00-23_ac5d8fd220f7/events.out.tfevents.1729566029.ac5d8fd220f7.881.2 +2 -2
runs/Oct22_03-00-23_ac5d8fd220f7/events.out.tfevents.1729567730.ac5d8fd220f7.881.3 +3 -0

README.md CHANGED Viewed

@@ -23,7 +23,7 @@ model-index:
     metrics:
     - name: Rouge1
       type: rouge
-      value: 0.4109
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -33,12 +33,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google-t5/t5-small](https://huggingface.co/google-t5/t5-small) on the samsum dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.8063
-- Rouge1: 0.4109
-- Rouge2: 0.1834
-- Rougel: 0.3429
-- Rougelsum: 0.343
-- Gen Len: 16.5562
 ## Model description
@@ -57,23 +57,24 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 4
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
-| 2.2685        | 1.0   | 921  | 1.8752          | 0.3961 | 0.1698 | 0.3294 | 0.3297    | 16.2836 |
-| 2.0494        | 2.0   | 1842 | 1.8315          | 0.406  | 0.1807 | 0.3408 | 0.3413    | 16.3484 |
-| 2.0014        | 3.0   | 2763 | 1.8096          | 0.4078 | 0.1802 | 0.3407 | 0.3407    | 16.6381 |
-| 1.9817        | 4.0   | 3684 | 1.8063          | 0.4109 | 0.1834 | 0.3429 | 0.343     | 16.5562 |
 ### Framework versions

     metrics:
     - name: Rouge1
       type: rouge
+      value: 0.4282
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [google-t5/t5-small](https://huggingface.co/google-t5/t5-small) on the samsum dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.7255
+- Rouge1: 0.4282
+- Rouge2: 0.2003
+- Rougel: 0.36
+- Rougelsum: 0.3596
+- Gen Len: 16.7372
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 3e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 5
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
+| 1.9452        | 1.0   | 921  | 1.7726          | 0.4147 | 0.1901 | 0.3492 | 0.3493    | 16.4719 |
+| 1.8952        | 2.0   | 1842 | 1.7498          | 0.4237 | 0.1971 | 0.3577 | 0.3577    | 16.4548 |
+| 1.8703        | 3.0   | 2763 | 1.7323          | 0.4243 | 0.1968 | 0.3571 | 0.3566    | 16.7689 |
+| 1.8579        | 4.0   | 3684 | 1.7310          | 0.4262 | 0.2012 | 0.3606 | 0.3604    | 16.7641 |
+| 1.8525        | 5.0   | 4605 | 1.7255          | 0.4282 | 0.2003 | 0.36   | 0.3596    | 16.7372 |
 ### Framework versions

runs/Oct22_03-00-23_ac5d8fd220f7/events.out.tfevents.1729566029.ac5d8fd220f7.881.2 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:741228a4d16ddbf7e34ff9137dc08b9c14dade9567314e41d259e3b69e0e9c46
-size 9930

 version https://git-lfs.github.com/spec/v1
+oid sha256:dee1e7ece571137529c4040890ad401c5fa6f829fbc1507f7b6eb09c0c512ff0
+size 10809

runs/Oct22_03-00-23_ac5d8fd220f7/events.out.tfevents.1729567730.ac5d8fd220f7.881.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8d8ce0bb24a1ef81383967c4511637a3d7fbb56d198b63e33b300f82bdc880f8
+size 613