martimfasantos
/

tinyllama-1.1b-mt-dpo-full_LR1e-7_BS32_rmsprop_3epochs_sft_sardine_dpo_sardine

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

tinyllama-1.1b-mt-dpo-full_LR1e-7_BS32_rmsprop_3epochs_sft_sardine_dpo_sardine

Commit History

End of training

f79f965
verified

martimfasantos commited on Jul 20

Model save

5ceb57d
verified

martimfasantos commited on Jul 20

Training in progress, step 1400

2df4a24
verified

martimfasantos commited on Jul 20

Training in progress, step 1300

c1421b8
verified

martimfasantos commited on Jul 20

Training in progress, step 1200

9478bee
verified

martimfasantos commited on Jul 20

Training in progress, step 1100

a268a39
verified

martimfasantos commited on Jul 20

Training in progress, step 1000

08f2986
verified

martimfasantos commited on Jul 20

Training in progress, step 900

7dcdde9
verified

martimfasantos commited on Jul 20

Training in progress, step 800

a2c8071
verified

martimfasantos commited on Jul 20

Training in progress, step 700

d806614
verified

martimfasantos commited on Jul 20

Training in progress, step 600

15801e7
verified

martimfasantos commited on Jul 20

Training in progress, step 500

667329d
verified

martimfasantos commited on Jul 20

Training in progress, step 400

6c6c7a8
verified

martimfasantos commited on Jul 20

Training in progress, step 300

6031df4
verified

martimfasantos commited on Jul 20

Training in progress, step 200

57e509b
verified

martimfasantos commited on Jul 20

Training in progress, step 100

76e00bd
verified

martimfasantos commited on Jul 20

initial commit

57d6fff
verified

martimfasantos commited on Jul 20