metadata
license: apache-2.0
datasets:
- nicholasKluge/Pt-Corpus
language:
- pt
É um modelo base pré-treinado com cerca de 1b tokens em portugues iniciado com os pesos oficiais do modelo, deve ser utilizado para fine tuning.
Obs: Aguardando resultados oficiais
Mistral Base PTBR | Mistral Base | Melhoria | |
---|---|---|---|
assin2_rte | 90,2 | 87,74 | 2,46 |
assin2_sts | 72,45 | 67,05 | 5,4 |
bluex | 53,27 | 53,27 | 0 |
enem | 64,66 | 62,42 | 2,24 |
faquad_nli | 68,11 | 47,63 | 20,48 |
hatebr_offensive_binary | 79,65 | 77,63 | 2,02 |
oab_exams | 45,42 | 45,24 | 0,18 |
portuguese_hate_speech_binary | 59,18 | 55,72 | 3,46 |