David-Xu
/

cira-7b-dpo-lora-merge

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

cira-7b-dpo-lora-merge / runs /Mar11_07-47-23_b89f062cf3e1 /events.out.tfevents.1710143296.b89f062cf3e1.43461.0

Commit History

Training in progress, step 900

89bd182
verified

David-Xu commited on Mar 11

Training in progress, step 800

911c464
verified

David-Xu commited on Mar 11

Training in progress, step 700

ecd44c8
verified

David-Xu commited on Mar 11

Training in progress, step 600

9d3b7a6
verified

David-Xu commited on Mar 11

Training in progress, step 500

9e12a43
verified

David-Xu commited on Mar 11

Training in progress, step 400

d6c23b4
verified

David-Xu commited on Mar 11

Training in progress, step 300

de5a6cc
verified

David-Xu commited on Mar 11

Training in progress, step 200

8923cfd
verified

David-Xu commited on Mar 11

Training in progress, step 100

c02505b
verified

David-Xu commited on Mar 11