David-Xu
/

cira-7b-dpo-lora-merge

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

cira-7b-dpo-lora-merge / training_args.bin

Commit History

Training in progress, step 1200

9527e1d
verified

David-Xu commited on Mar 11

Training in progress, step 900

89bd182
verified

David-Xu commited on Mar 11

Training in progress, step 100

c02505b
verified

David-Xu commited on Mar 11