THUDM
/

LongReward-llama3.1-8b-DPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LongReward-llama3.1-8b-DPO / README.md

Commit History

Update README.md

7311e4c
verified

NeoZ123 commited on 10 days ago

Update README.md

d89db22
verified

NeoZ123 commited on 10 days ago

add readme

db7b354

davidlvxin commited on 17 days ago