sahandrez
/

pairwise-reward-sft-zephyr-7b-sft-qlora-ultrafeedback

Generated from Trainer

Model card Files Files and versions Community

pairwise-reward-sft-zephyr-7b-sft-qlora-ultrafeedback / adapter_model.safetensors

Commit History

Model save

2e9e722
verified

sahandrez commited on Oct 14

Training in progress, step 1901

3ee98d3
verified

sahandrez commited on Oct 14

Training in progress, step 1500

35b590a
verified

sahandrez commited on Oct 14

Training in progress, step 1000

40b4340
verified

sahandrez commited on Oct 14

Training in progress, step 500

4d60276
verified

sahandrez commited on Oct 13