Adding Evaluation Results (#1)

Browse files

- Adding Evaluation Results (c7e8e6f8d36725e4baee9067ef1d0281d2513159)

Co-authored-by: Open LLM Leaderboard PR Bot <leaderboard-pr-bot@users.noreply.huggingface.co>

Files changed (1) hide show

README.md +19 -6

README.md CHANGED Viewed

@@ -1,22 +1,22 @@
 ---
 license: mit
-base_model: BramVanroy/fietje-2
 tags:
 - trl
 - fietje
 - alignment-handbook
 - sft
 datasets:
 - BramVanroy/ultrachat_200k_dutch
 - BramVanroy/no_robots_dutch
 - BramVanroy/belebele_dutch
 model-index:
 - name: fietje-2-instruct
   results: []
-pipeline_tag: text-generation
-inference: false
-language:
-- nl
 ---
 <p align="center" style="margin:0;padding:0">
@@ -93,4 +93,17 @@ The following hyperparameters were used during training:
 - Transformers 4.39.1
 - Pytorch 2.1.2+cu121
 - Datasets 2.18.0
-- Tokenizers 0.15.2

 ---
+language:
+- nl
 license: mit
 tags:
 - trl
 - fietje
 - alignment-handbook
 - sft
+base_model: BramVanroy/fietje-2
 datasets:
 - BramVanroy/ultrachat_200k_dutch
 - BramVanroy/no_robots_dutch
 - BramVanroy/belebele_dutch
+pipeline_tag: text-generation
+inference: false
 model-index:
 - name: fietje-2-instruct
   results: []
 ---
 <p align="center" style="margin:0;padding:0">
 - Transformers 4.39.1
 - Pytorch 2.1.2+cu121
 - Datasets 2.18.0
+- Tokenizers 0.15.2
+# [Open LLM Leaderboard Evaluation Results](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard)
+Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/details_BramVanroy__fietje-2-instruct)
+|      Metric       |Value|
+|-------------------|----:|
+|Avg.               |10.20|
+|IFEval (0-Shot)    |27.90|
+|BBH (3-Shot)       |17.57|
+|MATH Lvl 5 (4-Shot)| 0.53|
+|GPQA (0-shot)      | 0.00|
+|MuSR (0-shot)      | 2.91|
+|MMLU-PRO (5-shot)  |12.26|