XiaoY1
/

Qwen2-7B-Instruct-DPO-math-beta0.5

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-7B-Instruct-DPO-math-beta0.5 / adapter_model.safetensors

Commit History

Upload adapter_model.safetensors with huggingface_hub

79c0c2e
verified

XiaoY1 commited on Sep 9