Minbyul
/

biomistral-7b-wo-kqa_golden-iter-sft-dpo-step1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

biomistral-7b-wo-kqa_golden-iter-sft-dpo-step1 / model-00002-of-00003.safetensors

Commit History

Model save

1da39b6
verified

Minbyul commited on May 7