M4-ai
/

TinyMistral-6x248M

Text Generation

Mixture of Experts

Locutusque/TinyMistral-248M-v2

Locutusque/TinyMistral-248M-v2.5

Locutusque/TinyMistral-248M-v2.5-Instruct

jtatman/tinymistral-v2-pycoder-instruct-248m

Felladrin/TinyMistral-248M-SFT-v4

Locutusque/TinyMistral-248M-v2-Instruct

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Locutusque commited on Jan 30

Commit

2b4c079

•

1 Parent(s): cd02536

Update README.md

Files changed (1) hide show

README.md +13 -1

README.md CHANGED Viewed

@@ -51,7 +51,19 @@ TinyMistral-6x248M is a Mixure of Experts (MoE) made with the following models u
 * [Felladrin/TinyMistral-248M-SFT-v4](https://huggingface.co/Felladrin/TinyMistral-248M-SFT-v4)
 * [Locutusque/TinyMistral-248M-v2-Instruct](https://huggingface.co/Locutusque/TinyMistral-248M-v2-Instruct)
-The resulting model is then pre-trained on 600,000 examples of nampdn-ai/mini-peS2o
 ## 🧩 Configuration

 * [Felladrin/TinyMistral-248M-SFT-v4](https://huggingface.co/Felladrin/TinyMistral-248M-SFT-v4)
 * [Locutusque/TinyMistral-248M-v2-Instruct](https://huggingface.co/Locutusque/TinyMistral-248M-v2-Instruct)
+The resulting model is then pre-trained on 600,000 examples of nampdn-ai/mini-peS2o.
+We don't recommend using the Inference API as the model has serious performance degradation.
+### Recommended inference parameters
+```
+do_sample: true
+temperature: 0.2
+top_p: 0.14
+top_k: 12
+repetition_penalty: 1.15
+```
 ## 🧩 Configuration