Holarissun
/

RM-helpful_helpful_gpt4_loraR64_20000_gemma2b_lr1e-05_bs2_g4

Generated from Trainer

Model card Files Files and versions Community

RM-helpful_helpful_gpt4_loraR64_20000_gemma2b_lr1e-05_bs2_g4 / tokenizer.json

Commit History

End of training

793a58a
verified

Holarissun commited on May 3