cookinai
/

OrcaHermes-Mistral-70B-miqu

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

cookinai commited on Feb 18

Commit

3432d47

•

1 Parent(s): 649ff4a

Update README.md

Files changed (1) hide show

README.md +13 -12

README.md CHANGED Viewed

@@ -6,20 +6,21 @@ tags:
 - merge
 ---
-# merge-output
-This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
-## Merge Details
-### Merge Method
-This model was merged using the SLERP merge method.
 ### Models Merged
 The following models were included in the merge:
-* D:\\ai\\merges\\transformers\\models\\miquhermes\\miqu-openhermes-full
-* D:\\ai\\merges\\transformers\\models\\senku\\Senku-70B-Full
 ### Configuration
@@ -28,12 +29,12 @@ The following YAML configuration was used to produce this model:
 ```yaml
 slices:
   - sources:
-      - model: D:\\ai\\merges\\transformers\\models\\senku\\Senku-70B-Full
         layer_range: [0, 80]
-      - model: D:\\ai\\merges\\transformers\\models\\miquhermes\\miqu-openhermes-full
         layer_range: [0, 80]
 merge_method: slerp
-base_model: D:\\ai\\merges\\transformers\\models\\senku\\Senku-70B-Full
 parameters:
   t:
     - filter: self_attn

 - merge
 ---
+# OrcaHermes-Mistral-70B
+This model was created by SLERP Merging 2 Miqu Models trained on 2 high preforming datsets
+Just an experiment have not seen much miqu slerps yet.
 ### Models Merged
 The following models were included in the merge:
+[Miqu-Openhermes](https://huggingface.co/alicecomfy/miqu-openhermes-full)
+- Base Miqu Trained on [Openhermes](https://huggingface.co/datasets/teknium/OpenHermes-2.5)
+[ShinojiResearch/Senku-70B-Full](https://huggingface.co/ShinojiResearch/Senku-70B-Full)
+- Base Miqu Trained on [Slimorca](https://huggingface.co/datasets/Open-Orca/SlimOrca)
 ### Configuration
 ```yaml
 slices:
   - sources:
+      - model: local//path//to//Senku-70B-Full
         layer_range: [0, 80]
+      - model: local//path//to//miqu-openhermes-full
         layer_range: [0, 80]
 merge_method: slerp
+base_model: local//path//to//Senku-70B-Full
 parameters:
   t:
     - filter: self_attn