David-Xu
/

cira-7b-dpo-lora-merge

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

cira-7b-dpo-lora-merge / trainer_state.json

Commit History

Training in progress, step 900

89bd182
verified

David-Xu commited on Mar 11