d0rj
/

rut5-base-summ

text2text-generation

dialogue-summarization

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Edit model card

rut5-base-summ

Model

Finetuned ai-forever/ruT5-base for text and dialogue summarization.

Data

All 'train' subsets was concatenated and shuffled with seed 1000 - 7.

Train subset = 155678 rows.

Metrics

Evaluation on 10% of concatenated 'validation' subsets = 1458 rows.

See WandB logs.

See report at REPORT WIP.

Notes

Scheduler, optimizer and trainer states are saved into this repo, so you can use that to continue finetune with your own data with existing gradients.

Usage

Summarization pipeline

from transformers import pipeline


pipe = pipeline('summarization', model='d0rj/rut5-base-summ')
pipe(text)

Text-to-text generation

from transformers import T5Tokenizer, T5ForConditionalGeneration


tokenizer = T5Tokenizer.from_pretrained('d0rj/rut5-base-summ')
model = T5ForConditionalGeneration.from_pretrained('d0rj/rut5-base-summ').eval()

input_ids = tokenizer(text, return_tensors='pt').input_ids
outputs = model.generate(input_ids)
summary = tokenizer.decode(outputs[0], skip_special_tokens=True)

Downloads last month: 210

Safetensors

Model size

223M params

Tensor type

F32

·

Inference Examples

This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for d0rj/rut5-base-summ

Adapters

1 model

Finetunes

Datasets used to train d0rj/rut5-base-summ

Spaces using d0rj/rut5-base-summ 2

Collection including d0rj/rut5-base-summ

Summarization models

2 items • Updated Sep 20

Evaluation results

ROUGE-1 on samsum
test set verified

28.869
ROUGE-2 on samsum
test set verified

8.469
ROUGE-L on samsum
test set verified

24.236
ROUGE-LSUM on samsum
test set verified

25.854
loss on samsum
test set verified

3.246
gen_len on samsum
test set verified

27.554
ROUGE-1 on xsum
test set verified

16.128
ROUGE-2 on xsum
test set verified

2.113
ROUGE-L on xsum
test set verified

12.203
ROUGE-LSUM on xsum
test set verified

12.413

View on Papers With Code