David-Xu
/

cira-7b-dpo-lora-merge

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

cira-7b-dpo-lora-merge

Commit History

Upload tokenizer

e525d0f
verified

David-Xu commited on Mar 11

initial commit

bdfeb75
verified

David-Xu commited on Mar 11