martimfasantos
/

tinyllama-1.1b-sum-dpo-full_LR5e-8_2epochs_old

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

tinyllama-1.1b-sum-dpo-full_LR5e-8_2epochs_old / model.safetensors

Commit History

Training in progress, step 1100

f7797b7
verified

martimfasantos commited on Jun 17

Training in progress, step 1000

168af18
verified

martimfasantos commited on Jun 17

Training in progress, step 900

f5eb3c5
verified

martimfasantos commited on Jun 17

Training in progress, step 800

4762cb1
verified

martimfasantos commited on Jun 17

Training in progress, step 700

d52b05f
verified

martimfasantos commited on Jun 17

Training in progress, step 600

3ca83c2
verified

martimfasantos commited on Jun 17

Training in progress, step 500

45fc15a
verified

martimfasantos commited on Jun 17

Training in progress, step 400

3ba182d
verified

martimfasantos commited on Jun 17

Training in progress, step 300

599bea1
verified

martimfasantos commited on Jun 17

Training in progress, step 200

183a871
verified

martimfasantos commited on Jun 17

Training in progress, step 100

986f33e
verified

martimfasantos commited on Jun 17