tanliboy
/

lambda-qwen2.5-14b-dpo-test

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

lambda-qwen2.5-14b-dpo-test

Commit History

End of training

96607ee
verified

tanliboy commited on Sep 20

Model save

5d863b5
verified

tanliboy commited on Sep 20

initial commit

3ea4ec1
verified

tanliboy commited on Sep 20