David-Xu
/

cira-7b-dpo-lora-merge

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

cira-7b-dpo-lora-merge / runs /Mar11_09-57-38_b89f062cf3e1 /events.out.tfevents.1710151117.b89f062cf3e1.133799.0

Commit History

Training in progress, step 1200

9527e1d
verified

David-Xu commited on Mar 11

Training in progress, step 1000

811d3e3
verified

David-Xu commited on Mar 11

Training in progress, step 900

89bd182
verified

David-Xu commited on Mar 11