metadata

license: apache-2.0
base_model: t5-small
tags:
  - generated_from_trainer
datasets:
  - samsum
metrics:
  - rouge
model-index:
  - name: t5-small-t5-dialogue-summarizer
    results:
      - task:
          name: Sequence-to-sequence Language Modeling
          type: text2text-generation
        dataset:
          name: samsum
          type: samsum
          config: samsum
          split: validation
          args: samsum
        metrics:
          - name: Rouge1
            type: rouge
            value: 41.7031

t5-small-t5-dialogue-summarizer

This model is a fine-tuned version of t5-small on the samsum dataset. It achieves the following results on the evaluation set:

Loss: 1.7687
Rouge1: 41.7031
Rouge2: 18.7783
Rougel: 35.1492
Rougelsum: 38.6317
Gen Len: 16.5685

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

learning_rate: 2e-05
train_batch_size: 16
eval_batch_size: 16
seed: 42
gradient_accumulation_steps: 2
total_train_batch_size: 32
optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 6
mixed_precision_training: Native AMP

Training results

Training Loss	Epoch	Step	Validation Loss	Rouge1	Rouge2	Rougel	Rougelsum	Gen Len
No log	1.0	460	1.8087	40.9414	18.2439	34.4046	38.0469	16.4645
1.9998	2.0	921	1.7943	41.09	18.2457	34.4794	38.098	16.5538
1.9621	3.0	1381	1.7809	41.6111	18.5089	34.9893	38.6344	16.5795
1.9445	4.0	1842	1.7731	41.7145	18.7104	35.1886	38.7006	16.6198
1.9227	5.0	2302	1.7702	41.5079	18.5223	34.9946	38.4816	16.5575
1.9142	5.99	2760	1.7687	41.7031	18.7783	35.1492	38.6317	16.5685

Framework versions

Transformers 4.35.2
Pytorch 2.1.0+cu118
Datasets 2.15.0
Tokenizers 0.15.0