ZhangShenao
/

SELM-Zephyr-7B-iter-2

Text Generation

alignment-handbook

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

ZhangShenao commited on May 29

Commit

141a346

•

1 Parent(s): 862e9b8

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -18,7 +18,7 @@ should probably proofread and complete it, then remove this comment. -->
 Self-Exploring Language Models: Active Preference Elicitation for Online Alignment.
-# SELM-Zephyr-7B-iter-3
 This model is a fine-tuned version of [ZhangShenao/SELM-Zephyr-7B-iter-1](https://huggingface.co/ZhangShenao/SELM-Zephyr-7B-iter-1) using synthetic data based on on the HuggingFaceH4/ultrafeedback_binarized dataset.

 Self-Exploring Language Models: Active Preference Elicitation for Online Alignment.
+# SELM-Zephyr-7B-iter-2
 This model is a fine-tuned version of [ZhangShenao/SELM-Zephyr-7B-iter-1](https://huggingface.co/ZhangShenao/SELM-Zephyr-7B-iter-1) using synthetic data based on on the HuggingFaceH4/ultrafeedback_binarized dataset.