IMJONEZZ
/

SlovenBERTcina

@@ -14,21 +14,21 @@ RoBERTA pretrained tokenizer vocab and merges included.
 - **Preprocessing**:
   Tokenized with a pretrained ByteLevelBPETokenizer trained on the same dataset. Uncased, with s, pad, /s, unk, and mask special tokens.
 - **Evaluation results**:
-  - Mnoho ľudí tu<mask>
-    * žije.
-    * žijú.
-    * je.
-    * trpí.
-  - Ako sa<mask>
-    * máte
-    * máš
-    * má
-    * hovorí
-  - Plážová sezóna pod Zoborom patrí medzi<mask> obdobia.
-    * ročné
-    * najkrajšie
-    * najobľúbenejšie
-    * najnáročnejšie
 - **Limitations**:
   The current model is fairly small, although it works very well. This model is meant to be finetuned on downstream tasks e.g. Part-of-Speech tagging, Question Answering, anything in GLUE or SUPERGLUE.

 - **Preprocessing**:
   Tokenized with a pretrained ByteLevelBPETokenizer trained on the same dataset. Uncased, with s, pad, /s, unk, and mask special tokens.
 - **Evaluation results**:
+  - Mnoho ľudí tu MASK
+    - žije.
+    - žijú.
+    - je.
+    - trpí.
+  - Ako sa MASK
+    - máte
+    - máš
+    - má
+    - hovorí
+  - Plážová sezóna pod Zoborom patrí medzi MASK obdobia.
+    - ročné
+    - najkrajšie
+    - najobľúbenejšie
+    - najnáročnejšie
 - **Limitations**:
   The current model is fairly small, although it works very well. This model is meant to be finetuned on downstream tasks e.g. Part-of-Speech tagging, Question Answering, anything in GLUE or SUPERGLUE.