aixsatoshi
/

Mixtral-8x7B-ja-Lora-sft-ChatbotArenaJAcalm2

Model card Files Files and versions Community

aixsatoshi commited on Feb 8

Commit

87bbcd3

•

1 Parent(s): 7732356

Update README.md

Files changed (1) hide show

README.md +1 -0

README.md CHANGED Viewed

@@ -77,6 +77,7 @@ Lora学習時のcontext長は4096tokenまでですが、4k token以上の出力
 注：bf16での使用を想定しています。
 量子化推論する場合は、bf16でモデルを読み込んだ状態でLora適応またはマージ、その後に量子化してください。
 学習強度が1/3と、2/3のcheck pointも公開しました
 こちらのほうがベースモデルの汎化性能維持できている可能性があります

 注：bf16での使用を想定しています。
 量子化推論する場合は、bf16でモデルを読み込んだ状態でLora適応またはマージ、その後に量子化してください。
+**2/8更新**
 学習強度が1/3と、2/3のcheck pointも公開しました
 こちらのほうがベースモデルの汎化性能維持できている可能性があります