metadata

library_name: transformers
license: apache-2.0
base_model: google/mt5-small
tags:
  - summarization
  - generated_from_trainer
metrics:
  - rouge
model-index:
  - name: mt5-small-finetuned-amazon-en-es
    results: []

mt5-small-finetuned-amazon-en-es

This model is a fine-tuned version of google/mt5-small on an unknown dataset. It achieves the following results on the evaluation set:

Loss: 3.0303
Rouge1: 16.5661
Rouge2: 7.6422
Rougel: 15.9325
Rougelsum: 16.1062

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

learning_rate: 5.6e-05
train_batch_size: 8
eval_batch_size: 8
seed: 42
optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 8

Training results

Training Loss	Epoch	Step	Validation Loss	Rouge1	Rouge2	Rougel	Rougelsum
6.9675	1.0	1209	3.2986	15.3957	6.8712	14.6828	14.7531
3.8997	2.0	2418	3.1665	16.4337	7.643	15.6402	15.7636
3.5826	3.0	3627	3.1106	17.1701	8.4324	16.2932	16.4799
3.421	4.0	4836	3.0963	17.3456	8.7698	16.6576	16.7746
3.3089	5.0	6045	3.0490	16.7603	7.6345	16.1315	16.163
3.2437	6.0	7254	3.0401	16.6348	7.9563	15.8642	16.0271
3.2133	7.0	8463	3.0292	16.3252	7.6422	15.8291	15.9831
3.1851	8.0	9672	3.0303	16.5661	7.6422	15.9325	16.1062

Framework versions

Transformers 4.45.2
Pytorch 2.5.1+cu121
Datasets 3.1.0
Tokenizers 0.20.3