THUDM
/

LongReward-llama3.1-8b-DPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LongReward-llama3.1-8b-DPO

Commit History

Update README.md

7311e4c
verified

NeoZ123 commited on Oct 29

Update README.md

d89db22
verified

NeoZ123 commited on Oct 29

add readme

db7b354

davidlvxin commited on Oct 22

Upload folder using huggingface_hub

a74f280
verified

davidlvxin commited on Oct 22

initial commit

e489903
verified

davidlvxin commited on Oct 22