David-Xu
/

cira-7b-dpo-lora-merge

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

cira-7b-dpo-lora-merge / README.md

Commit History

Upload tokenizer

e525d0f
verified

David-Xu commited on Mar 11