diff --git "a/stats/compression_rate.json" "b/stats/compression_rate.json" --- "a/stats/compression_rate.json" +++ "b/stats/compression_rate.json" @@ -6970,5 +6970,2645 @@ "oov_ratio": 0.0016303777777914087, "_oov_charset": "[\"\", \"¿\", \"ó\", \"¡\", \"😉\", \"«\", \"😦\", \"❤\", \"Á\", \"✖\", \"👏\", \"®\", \"^\", \"€\", \"😀\", \"ö\", \"″\", \"🙁\", \"©\", \"²\", \"Ú\", \"ò\", \"é\", \"»\", \"´\", \"✔\", \"🙂\", \"Ñ\", \"­\", \"Ó\", \"á\", \"•\", \"️\", \"ª\", \"ý\", \"’\", \"М\", \"▷\", \"←\", \"ú\", \"‘\", \"👍\", \"„\", \"…\", \"✓\", \"í\", \"º\", \"✪\", \"‘\", \"Í\"]", "lossless": false + }, + "deepseek-ai/deepseek-llm-7b-base @ cc100/ar": { + "tokenizer": "deepseek-llm-7b-base", + "organization": "DeepSeek", + "vocab_size": 100015, + "_n_bytes": 2813283, + "_n_tokens": 1416103, + "_n_chars": 1560987, + "_n_oov_chars": 1, + "oov_ratio": 6.406203254735626e-07, + "_oov_charset": "[\"ö\"]", + "lossless": false + }, + "deepseek-ai/deepseek-llm-7b-base @ cc100/de": { + "tokenizer": "deepseek-llm-7b-base", + "organization": "DeepSeek", + "vocab_size": 100015, + "_n_bytes": 1814876, + "_n_tokens": 632573, + "_n_chars": 1784021, + "_n_oov_chars": 13536, + "oov_ratio": 0.007587354633157345, + "_oov_charset": "[\"û\", \"ü\", \"Á\", \"ú\", \"ö\", \"ø\"]", + "lossless": false + }, + "deepseek-ai/deepseek-llm-7b-base @ cc100/fa": { + "tokenizer": "deepseek-llm-7b-base", + "organization": "DeepSeek", + "vocab_size": 100015, + "_n_bytes": 2054052, + "_n_tokens": 963451, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "deepseek-ai/deepseek-llm-7b-base @ cc100/ja": { + "tokenizer": "deepseek-llm-7b-base", + "organization": "DeepSeek", + "vocab_size": 100015, + "_n_bytes": 1774770, + "_n_tokens": 751467, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "deepseek-ai/deepseek-llm-7b-base @ cc100/ko": { + "tokenizer": "deepseek-llm-7b-base", + "organization": "DeepSeek", + "vocab_size": 100015, + "_n_bytes": 1524839, + "_n_tokens": 1071983, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "eson/kplug-base-encoder @ cc100/ar": { + "tokenizer": "kplug", + "organization": "JD", + "vocab_size": 10261, + "_n_bytes": 2813283, + "_n_tokens": 311987, + "_n_chars": 1560987, + "_n_oov_chars": 1352386, + "oov_ratio": 0.8663659594858893, + "_oov_charset": "[\" \", \"ﷺ\", \"â\", \"ﻻ\", \"😊\", \"٦\", \"T\", \"۲\", \"ع\", \"ί\", \"ذ\", \"ﻹ\", \"
\", \"۷\", \"▪\", \"٩\", \"ي\", \"۸\", \"د\", \"٣\", \"à\", \"ى\", \"I\", \"ة\", \"U\", \"ن\", \"ب\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"V\", \"غ\", \"¡\", \"۰\", \"ط\", \"ء\", \"é\", \"،\", \"G\", \"٪\", \"A\", \"ۚ\", \"😀\", \"N\", \"چ\", \"ك\", \"♥\", \"ۗ\", \"Y\", \"½\", \"ٹ\", \"ظ\", \"‏\", \"🙂\", \"X\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"إ\", \"B\", \"K\", \"ٰ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"F\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"P\", \"أ\", \"R\", \"٢\", \"ش\", \"ö\", \"ٍ\", \"▫\", \"ُ\", \"M\", \"J\", \"ِ\", \"٧\", \"؟\", \"Х\", \"H\", \"\", \"ٱ\", \"‎\", \"ث\", \"W\", \"©\", \"ή\", \"ﻷ\", \"ل\", \"​\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"®\", \"ص\", \"Q\", \"ؤ\", \"E\", \"ä\", \"‌\", \"م\", \"‬\", \"ر\", \"ا\", \"س\", \"ق\", \"﴿\", \"ه\", \"�\", \"ف\", \"؛\", \"O\", \"ھ\", \"S\", \"و\", \"L\"]", + "lossless": false + }, + "eson/kplug-base-encoder @ cc100/de": { + "tokenizer": "kplug", + "organization": "JD", + "vocab_size": 10261, + "_n_bytes": 1814876, + "_n_tokens": 769053, + "_n_chars": 1784021, + "_n_oov_chars": 111071, + "oov_ratio": 0.06225879628098548, + "_oov_charset": "[\"â\", \"\", \"ó\", \"T\", \"‚\", \"–\", \"Ã\", \"­\", \" \", \"ί\", \"Á\", \"̈\", \"™\", \"„\", \"à\", \"I\", \"å\", \"á\", \"U\", \"É\", \"¶\", \"œ\", \"V\", \"ú\", \"≠\", \"ā\", \"ớ\", \"é\", \"G\", \"A\", \"ç\", \"😀\", \"N\", \"Ü\", \"♥\", \"🙁\", \"😂\", \"ï\", \"Y\", \"😃\", \"½\", \"🙂\", \"❤\", \"X\", \"ư\", \"´\", \"B\", \"K\", \"😉\", \"Ø\", \"C\", \"Z\", \"D\", \"😈\", \"F\", \"↩\", \"ć\", \"P\", \"R\", \"‐\", \"ö\", \"😢\", \"ô\", \"¬\", \"`\", \"M\", \"J\", \"û\", \"H\", \"š\", \"‎\", \"İ\", \"ė\", \"Ÿ\", \"‽\", \"W\", \"Ä\", \"è\", \"➔\", \"©\", \"😦\", \"​\", \"☺\", \"ü\", \"č\", \"Q\", \"ä\", \"E\", \"“\", \"ń\", \"😆\", \"♦\", \"¿\", \"�\", \"Ö\", \"🙄\", \"O\", \"S\", \"L\"]", + "lossless": false + }, + "eson/kplug-base-encoder @ cc100/fa": { + "tokenizer": "kplug", + "organization": "JD", + "vocab_size": 10261, + "_n_bytes": 2054052, + "_n_tokens": 254671, + "_n_chars": 1145876, + "_n_oov_chars": 1017925, + "oov_ratio": 0.8883378306204162, + "_oov_charset": "[\" \", \"T\", \"۲\", \"ع\", \"­\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"ي\", \"۱\", \"د\", \"۸\", \"٣\", \"I\", \"ى\", \"ة\", \"ۀ\", \"U\", \"گ\", \"ن\", \"◄\", \"ب\", \"پ\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"V\", \"غ\", \"۰\", \"ء\", \"ط\", \"،\", \"G\", \"٪\", \"A\", \"N\", \"چ\", \"ك\", \"۔\", \"♥\", \"ט\", \"ڪ\", \"Y\", \"ے\", \"ظ\", \"‏\", \"❤\", \"X\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"ﮧ\", \"۴\", \"B\", \"إ\", \"K\", \"ּ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"٫\", \"F\", \"‍\", \"ج\", \"P\", \"أ\", \"R\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"M\", \"ٴ\", \"J\", \"ِ\", \"٧\", \"؟\", \"H\", \"\", \"‎\", \"ث\", \"۵\", \"W\", \"▐\", \"©\", \"ل\", \"️\", \"​\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"Q\", \"۹\", \"ؤ\", \"E\", \"‌\", \"م\", \"ر\", \"ا\", \"س\", \"ق\", \"ه\", \"�\", \"ف\", \"؛\", \"O\", \"ھ\", \"S\", \"و\", \"L\"]", + "lossless": false + }, + "eson/kplug-base-encoder @ cc100/ja": { + "tokenizer": "kplug", + "organization": "JD", + "vocab_size": 10261, + "_n_bytes": 1774770, + "_n_tokens": 318023, + "_n_chars": 603065, + "_n_oov_chars": 416951, + "oov_ratio": 0.691386500625969, + "_oov_charset": "[\"ネ\", \"逡\", \"+\", \"陰\", \"ハ\", \"靄\", \"カ\", \"イ\", \"漁\", \"納\", \"樺\", \"猶\", \"標\", \"̈\", \"詐\", \"謎\", \"鍵\", \"ぇ\", \"堅\", \"サ\", \"業\", \"ま\", \"軟\", \"斉\", \"報\", \"謗\", \"艸\", \"I\", \"%\", \"斂\", \"習\", \"書\", \"喚\", \"こ\", \"個\", \"プ\", \"U\", \"渦\", \"濫\", \"縦\", \"築\", \"筆\", \"編\", \"預\", \"モ\", \"ィ\", \"長\", \"ざ\", \"V\", \"託\", \"龍\", \"偵\", \"棲\", \"遊\", \"&\", \"塚\", \"㎞\", \"憶\", \"W\", \"侶\", \"A\", \"殲\", \"鈴\", \"ぅ\", \"瘍\", \"ブ\", \"膿\", \"誇\", \"N\", \"ひ\", \"挿\", \"ゃ\", \"疎\", \"謝\", \"o\", \"傘\", \"謀\", \"な\", \"勢\", \"詞\", \"雲\", \"凍\", \"Y\", \"鳴\", \"E\", \"質\", \"彙\", \"妬\", \">\", \"穢\", \"穀\", \"頷\", \"瞭\", \"リ\", \"週\", \"還\", \"頂\", \"⑪\", \"計\", \"緩\", \"よ\", \"護\", \"B\", \"錬\", \"憤\", \"縞\", \"ツ\", \"ぞ\", \"ゼ\", \"袴\", \"鞄\", \"腫\", \"ㅂ\", \"捗\", \"滅\", \"ペ\", \"蓮\", \"館\", \"軒\", \"輩\", \"韓\", \"備\", \"創\", \"m\", \"導\", \"輔\", \"糾\", \"シ\", \"開\", \"ベ\", \"ぷ\", \"棟\", \"れ\", \"謂\", \"ヶ\", \"ね\", \"積\", \"び\", \"劇\", \"暫\", \"捨\", \"該\", \"た\", \"牽\", \"蒔\", \"⻑\", \"傷\", \"細\", \"`\", \"y\", \"絆\", \"N\", \"診\", \"許\", \"錠\", \"唄\", \"滲\", \"゚\", \"騰\", \"躊\", \"塵\", \"澪\", \"鳥\", \"H\", \"側\", \"記\", \"7\", \"響\", \"あ\", \"賀\", \"r\", \"グ\", \"貝\", \"並\", \"撫\", \"ニ\", \"ヒ\", \"賊\", \"漬\", \"贈\", \"誌\", \"ユ\", \"Ⅱ\", \"動\", \"飾\", \"辿\", \"💦\", \"そ\", \"紅\", \"ヨ\", \"ォ\", \"殺\", \"ル\", \"©\", \"岡\", \"譚\", \"潔\", \"漢\", \"3\", \"誕\", \"\\u001b\", \"費\", \"級\", \"く\", \"砦\", \"り\", \"聾\", \"針\", \"説\", \"Q\", \"w\", \"貴\", \"娯\", \"題\", \"賞\", \"ぱ\", \"給\", \"姦\", \"奪\", \"5\", \"ふ\", \"ヘ\", \"復\", \"い\", \"闊\", \"呑\", \"冊\", \"セ\", \"わ\", \"録\", \"D\", \"涼\", \"灘\", \"顎\", \"綜\", \"潤\", \"厭\", \"闖\", \"蝋\", \"疇\", \"ケ\", \"綾\", \"�\", \"艶\", \"償\", \"責\", \"砕\", \"X\", \"這\", \"運\", \"O\", \"B\", \"恥\", \"陸\", \"儀\", \"f\", \"L\", \"糞\", \"襲\", \"拠\", \"O\", \"駕\", \"ウ\", \"⇔\", \"ば\", \"え\", \"揚\", \"敵\", \"鍛\", \"バ\", \"ギ\", \"L\", \"衛\", \"債\", \"磯\", \"〟\", \"蘇\", \"節\", \"庫\", \"ッ\", \"輪\", \"墜\", \"ワ\", \"ゎ\", \"傾\", \"簡\", \"っ\", \"賭\", \"鬱\", \"類\", \"終\", \"陥\", \"隕\", \"R\", \"療\", \"贋\", \"罠\", \"視\", \"屓\", \"於\", \"痩\", \"〆\", \"準\", \"陳\", \"損\", \"コ\", \"暁\", \"に\", \"則\", \"ボ\", \"ミ\", \"惣\", \"纒\", \"強\", \"壇\", \"譜\", \"頭\", \"僅\", \"縫\", \"養\", \"で\", \"煩\", \"揮\", \"掻\", \"購\", \"韮\", \"ゅ\", \"Y\", \"時\", \"メ\", \"摂\", \"賑\", \"兎\", \"ゆ\", \"驚\", \"P\", \"す\", \"墾\", \"傑\", \"誘\", \"應\", \"結\", \"せ\", \"係\", \"聖\", \"頻\", \"曖\", \"K\", \"審\", \"詩\", \"紐\", \"Ⅶ\", \"賢\", \"嗚\", \"聞\", \"詠\", \"郵\", \"箋\", \"D\", \"艦\", \"桟\", \"衝\", \"阪\", \"盤\", \"ち\", \"ゲ\", \"ぼ\", \"嚥\", \"勲\", \"噴\", \"や\", \"醸\", \"‐\", \"蛍\", \"▷\", \"ポ\", \"飲\", \"場\", \"猟\", \"=\", \"ガ\", \"め\", \"b\", \"詮\", \"∇\", \"間\", \"フ\", \"ピ\", \"優\", \"談\", \"務\", \"奨\", \"園\", \"賃\", \"✨\", \"極\", \"欄\", \"陽\", \"飽\", \"華\", \"濃\", \"鍋\", \"ヨ\", \"貨\", \"贔\", \"訝\", \"デ\", \"W\", \"楊\", \"順\", \"員\", \"遼\", \"渕\", \"軸\", \"*\", \"環\", \"​\", \"親\", \"ダ\", \"/\", \"貸\", \"綻\", \"徹\", \"況\", \"幾\", \"ス\", \"測\", \"謙\", \"楓\", \"張\", \"倫\", \"梱\", \"絡\", \"9\", \"ろ\", \"紛\", \"悶\", \"n\", \"鋲\", \"彡\", \"缶\", \"鉱\", \"︎\", \"2\", \"ビ\", \"ュ\", \"啓\", \"須\", \"は\", \"貼\", \"過\", \"陣\", \"ゞ\", \"醤\", \"噛\", \"諏\", \"髭\", \"敗\", \"慮\", \"資\", \"薩\", \"G\", \"渇\", \"礫\", \"し\", \"糧\", \"嘆\", \"コ\", \"見\", \"礎\", \"﨑\", \"殻\", \"\\b\", \"機\", \"縛\", \"閑\", \"織\", \"S\", \"づ\", \"ゴ\", \"簗\", \"師\", \"減\", \"鯖\", \"貫\", \"a\", \"ン\", \"Ⅹ\", \"絶\", \"緒\", \"興\", \"餅\", \"黙\", \"腎\", \"獲\", \"臥\", \"謡\", \"確\", \"M\", \"連\", \"ぉ\", \"膚\", \"詈\", \"_\", \"Z\", \"d\", \"劉\", \"顕\", \"擬\", \"貞\", \"義\", \"テ\", \"協\", \"]\", \"C\", \"曇\", \"紋\", \"適\", \"婦\", \"0\", \"霧\", \"嶽\", \"軌\", \"臨\", \"奮\", \"綴\", \"ャ\", \"篤\", \"鏡\", \"ず\", \"駐\", \"飯\", \"虜\", \"穫\", \"監\", \"ド\", \"請\", \"H\", \"帳\", \"儲\", \"國\", \"澤\", \"誹\", \"憲\", \"揺\", \"罵\", \"約\", \"斬\", \"^\", \"潰\", \"純\", \"販\", \"き\", \"ヌ\", \"\\", \"G\", \"讐\", \"規\", \"ク\", \"鱈\", \"貧\", \"飛\", \"軋\", \"\", \"墳\", \"駒\", \"討\", \"課\", \"鈍\", \"沖\", \"捜\", \"さ\", \"誠\", \"懐\", \"銘\", \"̀\", \"ゝ\", \"島\", \"競\", \"ょ\", \"職\", \"喪\", \"併\", \"頃\", \"ナ\", \"慄\", \"衆\", \"諦\", \"覗\", \"A\", \"羅\", \"駿\", \"懇\", \"東\", \"憑\", \"e\", \"ノ\", \"掛\", \"買\", \"戯\", \"遙\", \"◯\", \"ラ\", \"緻\", \"無\", \"紡\", \"絞\", \"摯\", \"C\", \"匂\", \"偉\", \"腸\", \"轄\", \"問\", \"塊\", \"語\", \"メ\", \"銃\", \"財\", \"瘻\", \"閲\", \"飢\", \"オ\", \"趨\", \"F\", \"h\", \"ゥ\", \"漑\", \"麗\", \"て\", \"勝\", \"P\", \"$\", \" \", \"タ\", \"R\", \"か\", \"チ\", \"ぶ\", \"4\", \"尋\", \"ア\", \"愛\", \"鎖\", \"釘\", \"執\", \"貪\", \"遠\", \"議\", \"ぃ\", \"が\", \"ぐ\", \"ゾ\", \"範\", \"カ\", \"諸\", \"I\", \"統\", \"採\", \"噂\", \"釈\", \"ア\", \"宮\", \"壌\", \"ヤ\", \"ト\", \"る\", \"k\", \"8\", \"馳\", \"諺\", \"藁\", \"ョ\", \"舘\", \"ヵ\", \"廻\", \"囁\", \"́\", \"嘗\", \"繍\", \"綬\", \"餓\", \"リ\", \"貯\", \"葉\", \"罰\", \"輿\", \"調\", \"ウ\", \"寧\", \"[\", \"訴\", \"ぬ\", \"鮮\", \"粋\", \"キ\", \"®\", \"K\", \"煙\", \".\", \"締\", \"飴\", \"ゥ\", \"ィ\", \"貢\", \"繰\", \"賛\", \"塗\", \"ぽ\", \"紙\", \"ロ\", \"遡\", \"じ\", \"頒\", \"線\", \"鉢\", \"諾\", \"ら\", \"離\", \"貿\", \"飼\", \"欝\", \"お\", \"網\", \"酔\", \"鶏\", \"謄\", \"綺\", \"l\", \"進\", \"馬\", \"倉\", \"識\", \"慶\", \"繊\", \"ー\", \"裏\", \"籠\", \"違\", \"紹\", \"緑\", \"別\", \"レ\", \"ロ\", \"農\", \"貰\", \"層\", \"暦\", \"😊\", \"T\", \"訊\", \"脈\", \"構\", \"拶\", \"ぎ\", \"◡\", \"🌙\", \"緊\", \"鴻\", \"訃\", \"製\", \"を\", \"顔\", \"T\", \"ヴ\", \"顧\", \"詳\", \"😌\", \"閃\", \"練\", \"ど\", \"訣\", \"燭\", \"餃\", \"門\", \"贅\", \"S\", \"槍\", \"馴\", \"鉛\", \"g\", \"偽\", \"鵜\", \"遜\", \"絨\", \"@\", \"車\", \"態\", \"訪\", \"難\", \"鶴\", \"渓\", \"ヲ\", \"麹\", \"`\", \"��\", \"額\", \"ヽ\", \"電\", \"災\", \"ヘ\", \"t\", \"願\", \"\", \"複\", \"領\", \"遺\", \"鐘\", \"嘩\", \"認\", \"も\", \"項\", \"犠\", \"ヾ\", \"ホ\", \"薦\", \"熱\", \"蓋\", \"話\", \"種\", \"ム\", \"レ\", \"績\", \"懸\", \"X\", \"❤\", \"暢\", \"喩\", \"嵐\", \"訟\", \"む\", \"醜\", \"夢\", \"訂\", \"頑\", \"´\", \"慣\", \"ェ\", \"ジ\", \"維\", \"凱\", \"脅\", \"論\", \"・\", \"誰\", \"幣\", \"ぁ\", \"綱\", \"Z\", \"騒\", \"<\", \"湯\", \"鎮\", \"頓\", \"頬\", \"汚\", \"窪\", \"マ\", \"✧\", \"騙\", \"べ\", \"欽\", \"だ\", \"ソ\", \"パ\", \"組\", \"俵\", \"魚\", \"決\", \"😢\", \"げ\", \"詰\", \"爾\", \"獄\", \"釣\", \"ァ\", \"謬\", \"讃\", \"橋\", \"跡\", \"M\", \"試\", \"孫\", \"う\", \"纏\", \"J\", \"掃\", \"😭\", \"彌\", \"銀\", \"僕\", \"為\", \"ほ\", \"呂\", \"V\", \"ご\", \"J\", \"テ\", \"淵\", \"ザ\", \"負\", \"術\", \"‼\", \"設\", \"隊\", \"餌\", \"ぴ\", \"ん\", \"樹\", \"剰\", \"風\", \"躍\", \"エ\", \"U\", \"幹\", \"巣\", \"講\", \"と\", \"軍\", \"1\", \"擁\", \"評\", \"ズ\", \"産\", \"補\", \"撲\", \"現\", \"Д\", \"|\", \"へ\", \"閉\", \"曽\", \"轢\", \"異\", \"較\", \"ハ\", \"換\", \"詫\", \"饉\", \"呟\", \"誤\", \"穏\", \"賠\", \"訓\", \"選\", \"E\", \"紗\", \"ノ\", \"鋭\", \"拝\", \"゙\", \"躾\", \"階\", \"憂\", \"フ\", \"輸\", \"Q\", \"謳\", \"け\", \"筈\", \"載\", \"ぜ\", \"つ\", \"懲\", \"-\", \"峠\", \"億\", \"6\", \"際\", \"の\", \"輝\", \"閣\", \"縮\", \"錯\", \"緯\", \"貶\", \"達\", \"佇\", \"F\", \"枠\", \"後\", \"s\", \"棄\", \"紀\", \"و\", \"窮\", \"み\"]", + "lossless": false + }, + "eson/kplug-base-encoder @ cc100/ko": { + "tokenizer": "kplug", + "organization": "JD", + "vocab_size": 10261, + "_n_bytes": 1524839, + "_n_tokens": 202771, + "_n_chars": 655190, + "_n_oov_chars": 478807, + "oov_ratio": 0.7307910682397473, + "_oov_charset": "[\"교\", \"백\", \"낚\", \"뵙\", \"와\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"차\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"쏭\", \"딴\", \"U\", \"튠\", \"솥\", \"접\", \"냄\", \"힘\", \"A\", \"눌\", \"藝\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"녀\", \"數\", \"택\", \"슴\", \"퀄\", \"숟\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"ㅓ\", \"✈\", \"뤄\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"©\", \"녜\", \"헌\", \"識\", \"숨\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"섹\", \"룩\", \"걔\", \"겉\", \"연\", \"몽\", \"L\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"첨\", \"웃\", \"💕\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"풋\", \"딛\", \"㎍\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"♥\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"K\", \"왓\", \"꿕\", \"歲\", \"헨\", \"👍\", \"옵\", \"팡\", \"詠\", \"D\", \"합\", \"싼\", \"올\", \"폐\", \"띤\", \"닙\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"陽\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"콩\", \"리\", \"⑹\", \"說\", \"탓\", \"춧\", \"悧\", \"콤\", \"박\", \"믹\", \"將\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"適\", \"면\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"촌\", \"팽\", \"석\", \"쿄\", \"쌈\", \"굳\", \"갉\", \"킁\", \"劍\", \"넉\", \"잔\", \"더\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"럽\", \"롬\", \"緞\", \"겔\", \"東\", \"뛰\", \"틋\", \"즉\", \"캔\", \"無\", \"샹\", \"‪\", \"🍔\", \"語\", \"㉠\", \"존\", \"F\", \"생\", \"은\", \"훨\", \"て\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"愛\", \"웁\", \"끗\", \"쓴\", \"썸\", \"‎\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"윙\", \"셋\", \"鮮\", \"엄\", \"®\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"😣\", \"갯\", \"율\", \"꺼\", \"T\", \"짱\", \"둡\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"탱\", \"種\", \"넵\", \"흑\", \"렁\", \"X\", \"롤\", \"꼭\", \"꿨\", \"디\", \"實\", \"맡\", \"・\", \"烏\", \"씬\", \"ㅛ\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"앵\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"⬇\", \"뭔\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"용\", \"륜\", \"쪄\", \"덤\", \"즈\", \"돌\", \"덩\", \"왼\", \"먹\", \"I\", \"%\", \"♣\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"폰\", \"놓\", \"많\", \"직\", \"B\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"씨\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"룰\", \"즘\", \"익\", \"씀\", \"닐\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"動\", \"돔\", \"飾\", \"엌\", \"헉\", \"너\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"낙\", \"줏\", \"옌\", \"샴\", \"봅\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"쿨\", \"뜬\", \"고\", \"췌\", \"빗\", \"무\", \"배\", \"瀧\", \"브\", \"밧\", \"길\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"榮\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"‬\", \"벅\", \"︎\", \"역\", \"は\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"쥔\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"協\", \"높\", \"紋\", \"깥\", \"울\", \"슐\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"國\", \"릅\", \"跏\", \"🦄\", \"삭\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"ㅝ\", \"맥\", \"력\", \"㉿\", \"돈\", \"P\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"뜩\", \"렷\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"🦅\", \"宮\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"세\", \"뉜\", \"임\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"아\", \"휩\", \"훗\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"門\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"낫\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"덮\", \"좇\", \"밭\", \"Z\", \"◼\", \"黃\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"J\", \"목\", \"뱅\", \"퀵\", \"쏜\", \"얻\", \"몫\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"軍\", \"흡\", \"놈\", \"퀴\", \"뼘\", \"민\", \"닿\", \"봐\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"경\", \"묘\", \"냉\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"陰\", \"왁\", \"힙\", \"뽀\", \"원\", \"뻔\", \"↔\", \"樺\", \"펠\", \"빠\", \"😱\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"書\", \"얀\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"龍\", \"격\", \"쿤\", \"ç\", \"곁\", \"워\", \"N\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"꽝\", \"➎\", \"맛\", \"滅\", \"韓\", \"점\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"값\", \"짬\", \"뻐\", \"呪\", \"流\", \"뺑\", \"뮐\", \"H\", \"움\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"쏘\", \"닥\", \"Ⅱ\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"漢\", \"든\", \"ᴀ\", \"풀\", \"랄\", \"딥\", \"빵\", \"題\", \"씽\", \"웹\", \"い\", \"훅\", \"끄\", \"넷\", \"벚\", \"펑\", \"댓\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"陳\", \"쏠\", \"토\", \"픽\", \"좆\", \"頭\", \"🔹\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"한\", \"Y\", \"놔\", \"부\", \"헛\", \"밑\", \"샀\", \"샵\", \"す\", \"렛\", \"훔\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"굵\", \"끈\", \"훑\", \"싸\", \"벌\", \"W\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"師\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"톱\", \"ㅐ\", \"춥\", \"털\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"객\", \"덕\", \"믐\", \"았\", \"귈\", \"듭\", \"베\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"혀\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"천\", \"짧\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"⁴\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"🙌\", \"러\", \"ɪ\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"코\", \"뒀\", \"쒀\", \"상\", \"즌\", \"魯\", \"ㅘ\", \"닳\", \"銀\", \"척\", \"낱\", \"랑\", \"떼\", \"얼\", \"청\", \"씩\", \"앱\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"슷\", \"後\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"치\", \"핍\", \"칸\", \"잴\", \"꾀\", \"業\", \"둬\", \"여\", \"손\", \"長\", \"V\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"v\", \"雲\", \"쳐\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"벽\", \"기\", \"↕\", \"자\", \"쌩\", \"`\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"そ\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"슛\", \"섯\", \"걸\", \"불\", \"품\", \"찌\", \"Q\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"찼\", \"조\", \"O\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"콜\", \"딤\", \"겁\", \"時\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"Ⅶ\", \"빛\", \"켤\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"텐\", \"▷\", \"스\", \"턱\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"間\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"賣\", \"쇠\", \"華\", \"클\", \"🍎\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"​\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"셀\", \"키\", \"갇\", \"し\", \"걍\", \"不\", \"멈\", \"S\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"챨\", \"샘\", \"­\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"駐\", \"최\", \"쨌\", \"몬\", \"찮\", \"龍\", \"슬\", \"쟁\", \"븐\", \"흗\", \"톤\", \"양\", \"G\", \"핫\", \"셔\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"비\", \"C\", \"눕\", \"젊\", \"뀔\", \"R\", \" \", \"않\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"밉\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"파\", \"밥\", \"멀\", \"폍\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"넓\", \"쉬\", \"먼\", \"變\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"희\", \"크\", \"제\", \"패\", \"할\", \"현\", \"전\", \"선\", \"㉣\", \"셉\", \"췄\", \"왘\", \"ㅡ\", \"쑥\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"‍\", \"친\", \"맷\", \"쯔\", \"濁\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"M\", \"칩\", \"켐\", \"빔\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"樹\", \"는\", \"줍\", \"핥\", \"낼\", \"ㅞ\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"E\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\"]", + "lossless": false + }, + "fnlp/moss-moon-003-sft @ cc100/ar": { + "tokenizer": "moss-moon-003-sft", + "organization": "Fudan", + "vocab_size": 106072, + "_n_bytes": 2813283, + "_n_tokens": 1557671, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "fnlp/moss-moon-003-sft @ cc100/de": { + "tokenizer": "moss-moon-003-sft", + "organization": "Fudan", + "vocab_size": 106072, + "_n_bytes": 1814876, + "_n_tokens": 683401, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "fnlp/moss-moon-003-sft @ cc100/fa": { + "tokenizer": "moss-moon-003-sft", + "organization": "Fudan", + "vocab_size": 106072, + "_n_bytes": 2054052, + "_n_tokens": 1285426, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "fnlp/moss-moon-003-sft @ cc100/ja": { + "tokenizer": "moss-moon-003-sft", + "organization": "Fudan", + "vocab_size": 106072, + "_n_bytes": 1774770, + "_n_tokens": 600011, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "fnlp/moss-moon-003-sft @ cc100/ko": { + "tokenizer": "moss-moon-003-sft", + "organization": "Fudan", + "vocab_size": 106072, + "_n_bytes": 1524839, + "_n_tokens": 1305249, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "google-bert/bert-base-cased @ cc100/ar": { + "tokenizer": "bert-base-cased", + "organization": "Google", + "vocab_size": 28996, + "_n_bytes": 2813283, + "_n_tokens": 1212449, + "_n_chars": 1560987, + "_n_oov_chars": 16458, + "oov_ratio": 0.010543329316643892, + "_oov_charset": "[\"ﻷ\", \" \", \"ﷺ\", \"↩\", \"٪\", \"﴾\", \"​\", \"٨\", \"٤\", \"ۖ\", \"ۚ\", \"ﻻ\", \"١\", \"٢\", \"٦\", \"😊\", \"😀\", \"۲\", \"ً\", \"ٍ\", \"ۤ\", \"▫\", \"ُ\", \"ؤ\", \"ﻹ\", \"ۗ\", \"‌\", \"
\", \"۷\", \"‏\", \"🙂\", \"‬\", \"٧\", \"▪\", \"٩\", \"‹\", \"؟\", \"ّ\", \"ـ\", \"٣\", \"ٌ\", \"۸\", \"﴿\", \"ٱ\", \"‎\", \"ٰ\", \"٥\", \"⤴\", \"�\", \"ْ\", \"›\", \"؛\", \"۰\", \"█\", \"٠\", \"ھ\", \"\"]", + "lossless": false + }, + "google-bert/bert-base-cased @ cc100/de": { + "tokenizer": "bert-base-cased", + "organization": "Google", + "vocab_size": 28996, + "_n_bytes": 1814876, + "_n_tokens": 711022, + "_n_chars": 1784021, + "_n_oov_chars": 447, + "oov_ratio": 0.0002505575887279354, + "_oov_charset": "[\"😦\", \"↩\", \"​\", \"\", \"☺\", \"😀\", \"–\", \"Ã\", \"▼\", \"😢\", \"­\", \"🙁\", \" \", \"😂\", \"̈\", \"😃\", \"™\", \"“\", \"🙂\", \"❤\", \"„\", \"‹\", \"😆\", \"‎\", \"😉\", \"�\", \"Ÿ\", \"‽\", \"›\", \"♡\", \"😈\", \"🙄\", \"¤\", \"➔\"]", + "lossless": false + }, + "google-bert/bert-base-cased @ cc100/fa": { + "tokenizer": "bert-base-cased", + "organization": "Google", + "vocab_size": 28996, + "_n_bytes": 2054052, + "_n_tokens": 883078, + "_n_chars": 1145876, + "_n_oov_chars": 14745, + "oov_ratio": 0.012867884483137791, + "_oov_charset": "[\" \", \"٪\", \"️\", \"​\", \"٨\", \"٤\", \"١\", \"٢\", \"۔\", \"۲\", \"ً\", \"ٍ\", \"ۆ\", \"۶\", \"۳\", \"­\", \"ُ\", \"۹\", \"ؤ\", \"ڪ\", \"‌\", \"ٴ\", \"۷\", \"ژ\", \"‏\", \"❤\", \"٧\", \"✿\", \"٩\", \"ٔ\", \"؟\", \"ّ\", \"۱\", \"۸\", \"ـ\", \"ٌ\", \"٣\", \"ﮧ\", \"۴\", \"ۀ\", \"‎\", \"◄\", \"٥\", \"�\", \"۵\", \"ْ\", \"›\", \"؛\", \"۰\", \"٠\", \"ھ\", \"٫\", \"▐\", \"‍\", \"\"]", + "lossless": false + }, + "google-bert/bert-base-cased @ cc100/ja": { + "tokenizer": "bert-base-cased", + "organization": "Google", + "vocab_size": 28996, + "_n_bytes": 1774770, + "_n_tokens": 390483, + "_n_chars": 603065, + "_n_oov_chars": 216189, + "oov_ratio": 0.3584837455332344, + "_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"帝\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"合\", \"暴\", \"之\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"循\", \"喚\", \"惨\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"草\", \"憶\", \"截\", \"侶\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"護\", \"点\", \"法\", \"眠\", \"狭\", \"鎌\", \"ツ\", \"腫\", \"ゼ\", \"歌\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"曹\", \"開\", \"恰\", \"ぷ\", \"段\", \"捉\", \"送\", \"浩\", \"邸\", \"琢\", \"隆\", \"朝\", \"伊\", \"疾\", \"串\", \"笛\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"滲\", \"虐\", \"騰\", \"捐\", \"塵\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"貴\", \"珍\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"清\", \"家\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"陸\", \"亜\", \"f\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"倭\", \"表\", \"圃\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"〉\", \"可\", \"章\", \"杉\", \"氷\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"冷\", \"強\", \"壇\", \"祠\", \"五\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"泣\", \"候\", \"米\", \"勤\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"手\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \"必\", \"蛍\", \"材\", \"跨\", \"場\", \"胞\", \"潜\", \"猟\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"汁\", \"塔\", \"鍋\", \"妻\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"立\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"楓\", \"妊\", \"徳\", \"ろ\", \"悔\", \"抱\", \"剃\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"見\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"我\", \"促\", \"膚\", \"亀\", \"嘘\", \"脳\", \"卑\", \"Z\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"信\", \"役\", \"0\", \"稚\", \"嗅\", \"臨\", \"奮\", \"羊\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"介\", \"収\", \"略\", \"斬\", \"爪\", \"媒\", \"猿\", \"変\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"競\", \"々\", \"群\", \"救\", \"覗\", \"羅\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"語\", \"飢\", \"腺\", \"漑\", \"署\", \"塾\", \"募\", \"」\", \"チ\", \"掬\", \"律\", \"床\", \"狩\", \"ア\", \"号\", \"奔\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"綬\", \"端\", \"秤\", \"魂\", \"建\", \"輿\", \"駆\", \"[\", \"ぬ\", \"遂\", \"鮮\", \"粋\", \"想\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"延\", \"飼\", \"模\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"特\", \"貰\", \"払\", \"放\", \"叉\", \"博\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"を\", \"成\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"坂\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"レ\", \"懸\", \"久\", \"睡\", \"喩\", \"嵐\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"空\", \"往\", \"票\", \"団\", \"涅\", \"止\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"崩\", \"覆\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"舟\", \"告\", \"詰\", \"画\", \"爾\", \"昭\", \"豚\", \"釣\", \"紫\", \"謬\", \"悪\", \"橋\", \"試\", \"孫\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"風\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"精\", \"洋\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"糸\", \"面\", \"輝\", \"校\", \"等\", \"達\", \"勿\", \"欣\", \"迦\", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"英\", \"赤\", \"努\", \"効\", \"応\", \"%\", \"習\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"福\", \"躇\", \"鈴\", \"誇\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"保\", \"頂\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"恣\", \"碓\", \"梶\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \"棟\", \"退\", \"叫\", \"ね\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"戦\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"主\", \"礼\", \"賀\", \"揄\", \"膜\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"岡\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"セ\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"世\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"民\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"都\", \"阿\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"∇\", \"屋\", \"関\", \"優\", \"ピ\", \"彷\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"〈\", \"親\", \"翔\", \"垣\", \"永\", \"痢\", \"粒\", \"張\", \"香\", \"絡\", \"乱\", \"紛\", \"揉\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"曲\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"鹿\", \"寄\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"冒\", \"措\", \"雄\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"有\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"四\", \"ノ\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"股\", \"閲\", \"乳\", \"勝\", \"拘\", \"幡\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"出\", \"範\", \"斡\", \"街\", \"不\", \"様\", \"噂\", \"健\", \"景\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"行\", \"施\", \"惧\", \"痺\", \"巨\", \".\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"注\", \"足\", \"繰\", \"凡\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"古\", \"磋\", \"椒\", \"慈\", \"判\", \"酔\", \"杜\", \"悟\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"裏\", \"羽\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"定\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"贅\", \"科\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"名\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"ェ\", \"脅\", \"ぁ\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"砂\", \"密\", \"闘\", \"✧\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"幸\", \"呂\", \"ほ\", \"V\", \"ご\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"発\", \"薄\", \"U\", \"率\", \"稲\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"軍\", \"映\", \"補\", \"婿\", \"工\", \"へ\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"里\", \"幼\", \"繋\", \"内\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"比\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"落\", \"※\", \"使\", \"守\", \"漱\", \"泊\", \"編\", \"遊\", \"尊\", \"典\", \"W\", \"治\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"勢\", \"黄\", \"��\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"火\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"忠\", \"膝\", \"捗\", \"批\", \"滅\", \"沢\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"相\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"地\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"響\", \"己\", \"敏\", \"貝\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"末\", \"稼\", \"耳\", \"\\u001b\", \"漢\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"滓\", \"5\", \"盆\", \"需\", \"目\", \"没\", \"呑\", \"仮\", \"善\", \"闊\", \"肉\", \"D\", \"秀\", \"墓\", \"押\", \"蝋\", \"揃\", \"ケ\", \"壮\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"戒\", \"債\", \"磯\", \"匡\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"ワ\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"陳\", \"配\", \"付\", \"纒\", \"袈\", \"莫\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"短\", \"ぼ\", \"択\", \"届\", \"篇\", \"晋\", \"旋\", \"ポ\", \"=\", \"代\", \"誉\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"楊\", \"順\", \"匠\", \"栃\", \"耗\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"劉\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"眺\", \"企\", \"県\", \"児\", \"奈\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"併\", \"掲\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"宗\", \"懇\", \"午\", \"e\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"h\", \"趨\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"区\", \"楚\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"体\", \"解\", \"【\", \"勘\", \"良\", \"雇\", \"訴\", \"吸\", \"身\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"望\", \"ロ\", \"紙\", \"尿\", \"庭\", \"母\", \"線\", \"遇\", \"漠\", \"離\", \"貿\", \"示\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"昧\", \"倉\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"暖\", \"序\", \"宇\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"帰\", \"g\", \"幽\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"敷\", \"丈\", \"堵\", \"ホ\", \"弓\", \"逢\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"也\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"幣\", \"徨\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"秋\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"牛\", \"広\", \"化\", \"掃\", \"自\", \"父\", \"銀\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"設\", \"昨\", \"屈\", \"蹴\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"臆\", \"幅\", \"轢\", \"異\", \"八\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"憂\", \"伐\", \"炎\", \"迫\", \"筈\", \"寂\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"後\", \"改\", \"塞\", \"狐\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"甲\", \"業\", \"謗\", \"拙\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"モ\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"功\", \"岬\", \"丹\", \"ぞ\", \"経\", \"御\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"崎\", \"険\", \"色\", \"姉\", \"傷\", \"細\", \"囲\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"幕\", \"記\", \"航\", \"あ\", \"肌\", \"溢\", \"並\", \"筋\", \"哲\", \"ヒ\", \"贈\", \"ユ\", \"稜\", \"全\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"春\", \"歳\", \"旗\", \"苑\", \"聾\", \"観\", \"殊\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"ふ\", \"ヘ\", \"冨\", \"~\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"前\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"B\", \"寺\", \"糞\", \"暗\", \"的\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"墜\", \"簡\", \"っ\", \"彿\", \"加\", \"分\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"舗\", \"淫\", \"暁\", \"ボ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"メ\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"?\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"堂\", \"捧\", \"片\", \"釜\", \"撮\", \"b\", \"間\", \"極\", \"棚\", \"華\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"宣\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"​\", \"綻\", \"芸\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"↓\", \"「\", \"冬\", \"コ\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"凶\", \"警\", \"能\", \"_\", \"更\", \"姑\", \"森\", \"怠\", \"擬\", \"媚\", \"非\", \"駅\", \"供\", \"霧\", \"癌\", \"居\", \"座\", \"篤\", \"推\", \"駐\", \"志\", \"宜\", \"穫\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"曰\", \"讐\", \"鱈\", \"寛\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"底\", \"墳\", \"鈍\", \"沖\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"尺\", \"職\", \"烹\", \"会\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"蔑\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"遍\", \"男\", \"$\", \"髪\", \" \", \"政\", \"縄\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"元\", \"沈\", \"任\", \"壌\", \"馳\", \"ョ\", \"ヵ\", \"督\", \"燥\", \"餓\", \"簿\", \"葉\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"理\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"外\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"夏\", \"智\", \"晴\", \"頬\", \"汚\", \"学\", \"揶\", \"起\", \"番\", \"洒\", \"欽\", \"累\", \"破\", \"ァ\", \"讃\", \"瀬\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"千\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"樹\", \"楼\", \"始\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"雅\", \"評\", \"現\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]", + "lossless": false + }, + "google-bert/bert-base-cased @ cc100/ko": { + "tokenizer": "bert-base-cased", + "organization": "Google", + "vocab_size": 28996, + "_n_bytes": 1524839, + "_n_tokens": 202828, + "_n_chars": 655190, + "_n_oov_chars": 435031, + "oov_ratio": 0.663976861673713, + "_oov_charset": "[\"교\", \"帝\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"合\", \"차\", \"之\", \"욜\", \"엇\", \"그\", \"튼\", \"쏭\", \"딴\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"法\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"朝\", \"ㅓ\", \"✈\", \"뤄\", \"友\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"家\", \"몽\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"章\", \"〉\", \"可\", \"💕\", \"氷\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"五\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"왓\", \"꿕\", \"歲\", \"헨\", \"👍\", \"옵\", \"팡\", \"詠\", \"합\", \"싼\", \"述\", \"올\", \"手\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"立\", \"콩\", \"리\", \"⑹\", \"說\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"將\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"適\", \"信\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"辰\", \"굳\", \"갉\", \"쌈\", \"킁\", \"劍\", \"넉\", \"잔\", \"더\", \"▲\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"‪\", \"🍔\", \"語\", \"㉠\", \"존\", \"생\", \"은\", \"훨\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"‎\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"윙\", \"셋\", \"鮮\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"렁\", \"롤\", \"꼭\", \"꿨\", \"디\", \"實\", \"맡\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"昭\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"面\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"英\", \"덩\", \"왼\", \"먹\", \"%\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"福\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"›\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"主\", \"닐\", \"⑸\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"世\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"民\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"〈\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"永\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"‬\", \"벅\", \"︎\", \"역\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"雄\", \"릅\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"有\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"出\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"不\", \"🦅\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"行\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"古\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"德\", \"덮\", \"좇\", \"밭\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"목\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"軍\", \"흡\", \"놈\", \"퀴\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"里\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"槪\", \"���\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"比\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"樺\", \"펠\", \"빠\", \"😱\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"守\", \"∙\", \"얀\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"격\", \"典\", \"쿤\", \"治\", \"곁\", \"워\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"火\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"相\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"地\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"Ⅱ\", \"投\", \"奉\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"漢\", \"든\", \"ᴀ\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"웹\", \"目\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"벚\", \"펑\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"陳\", \"쏠\", \"토\", \"픽\", \"좆\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"놔\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"⑧\", \"렛\", \"□\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"代\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"님\", \"客\", \"師\", \"臀\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"宗\", \"객\", \"덕\", \"邦\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"秋\", \"至\", \"상\", \"즌\", \"魯\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"척\", \"낱\", \"랑\", \"射\", \"떼\", \"얼\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"八\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"後\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"御\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"자\", \"色\", \"쌩\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"春\", \"불\", \"품\", \"찌\", \"죄\", \"쁨\", \"덟\", \"귀\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"的\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"分\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"?\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"堂\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"間\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"賣\", \"쇠\", \"華\", \"클\", \"🍎\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"​\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"↓\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"­\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"居\", \"駐\", \"志\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"눕\", \"젊\", \"男\", \"뀔\", \" \", \"政\", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"外\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"‍\", \"친\", \"맷\", \"쯔\", \"濁\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"樹\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]", + "lossless": false + }, + "google-bert/bert-base-chinese @ cc100/ar": { + "tokenizer": "bert-base-chinese", + "organization": "Google", + "vocab_size": 21128, + "_n_bytes": 2813283, + "_n_tokens": 516389, + "_n_chars": 1560987, + "_n_oov_chars": 313181, + "oov_ratio": 0.2006301141521358, + "_oov_charset": "[\" \", \"ﷺ\", \"â\", \"L\", \"ﻻ\", \"😊\", \"٦\", \"T\", \"۲\", \"ί\", \"ذ\", \"ﻹ\", \"
\", \"۷\", \"٩\", \"۸\", \"٣\", \"à\", \"ى\", \"I\", \"U\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"V\", \"غ\", \"¡\", \"۰\", \"ء\", \"ط\", \"é\", \"،\", \"G\", \"٪\", \"A\", \"ۚ\", \"😀\", \"N\", \"چ\", \"ك\", \"ۗ\", \"Y\", \"½\", \"ٹ\", \"ظ\", \"‏\", \"🙂\", \"X\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"إ\", \"B\", \"K\", \"ٰ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"F\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"P\", \"أ\", \"R\", \"٢\", \"ش\", \"ö\", \"ٍ\", \"ُ\", \"“\", \"M\", \"J\", \"ِ\", \"٧\", \"؟\", \"Х\", \"H\", \"ٱ\", \"‎\", \"ث\", \"”\", \"W\", \"ή\", \"ﻷ\", \"​\", \"٨\", \"٤\", \"١\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"ص\", \"Q\", \"ؤ\", \"E\", \"ä\", \"‌\", \"—\", \"‬\", \"–\", \"ق\", \"﴿\", \"‘\", \"…\", \"�\", \"’\", \"ف\", \"؛\", \"O\", \"ھ\", \"S\", \"\"]", + "lossless": false + }, + "google-bert/bert-base-chinese @ cc100/de": { + "tokenizer": "bert-base-chinese", + "organization": "Google", + "vocab_size": 21128, + "_n_bytes": 1814876, + "_n_tokens": 541246, + "_n_chars": 1784021, + "_n_oov_chars": 113119, + "oov_ratio": 0.06340676483068304, + "_oov_charset": "[\" \", \"â\", \"\", \"ó\", \"T\", \"‚\", \"–\", \"Ã\", \"­\", \" \", \"ί\", \"Á\", \"̈\", \"„\", \"à\", \"I\", \"å\", \"á\", \"U\", \"É\", \"¶\", \"œ\", \"V\", \"ú\", \"≠\", \"ā\", \"ớ\", \"é\", \"G\", \"A\", \"ç\", \"😀\", \"N\", \"Ü\", \"🙁\", \"ï\", \"Y\", \"😃\", \"½\", \"🙂\", \"ư\", \"X\", \"´\", \"B\", \"K\", \"😉\", \"Ø\", \"C\", \"Z\", \"D\", \"😈\", \"F\", \"↩\", \"ć\", \"P\", \"R\", \"‐\", \"ö\", \"😢\", \"ô\", \"“\", \"¬\", \"`\", \"M\", \"J\", \"û\", \"H\", \"š\", \"‎\", \"İ\", \"”\", \"ė\", \"Ÿ\", \"‽\", \"W\", \"Ä\", \"è\", \"➔\", \"😦\", \"​\", \"ü\", \"č\", \"Q\", \"ä\", \"E\", \"—\", \"“\", \"ń\", \"😆\", \"–\", \"¿\", \"‘\", \"…\", \"’\", \"�\", \"Ö\", \"🙄\", \"O\", \"S\", \"L\"]", + "lossless": false + }, + "google-bert/bert-base-chinese @ cc100/fa": { + "tokenizer": "bert-base-chinese", + "organization": "Google", + "vocab_size": 21128, + "_n_bytes": 2054052, + "_n_tokens": 376414, + "_n_chars": 1145876, + "_n_oov_chars": 273120, + "oov_ratio": 0.23835039742520134, + "_oov_charset": "[\" \", \"T\", \"۲\", \"­\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"۱\", \"۸\", \"٣\", \"I\", \"ى\", \"ۀ\", \"U\", \"گ\", \"◄\", \"پ\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"V\", \"غ\", \"۰\", \"ء\", \"ط\", \"،\", \"G\", \"٪\", \"A\", \"N\", \"چ\", \"ك\", \"۔\", \"ט\", \"ڪ\", \"Y\", \"ے\", \"ظ\", \"‏\", \"X\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"ﮧ\", \"۴\", \"B\", \"إ\", \"K\", \"ּ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"٫\", \"F\", \"‍\", \"ج\", \"P\", \"أ\", \"R\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"“\", \"M\", \"ٴ\", \"J\", \"ِ\", \"٧\", \"؟\", \"H\", \"\", \"‎\", \"ث\", \"”\", \"۵\", \"W\", \"▐\", \"️\", \"​\", \"٨\", \"٤\", \"١\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"Q\", \"۹\", \"ؤ\", \"E\", \"‌\", \"–\", \"ق\", \"‘\", \"…\", \"�\", \"’\", \"ف\", \"؛\", \"O\", \"ھ\", \"S\", \"L\"]", + "lossless": false + }, + "google-bert/bert-base-chinese @ cc100/ja": { + "tokenizer": "bert-base-chinese", + "organization": "Google", + "vocab_size": 21128, + "_n_bytes": 1774770, + "_n_tokens": 376831, + "_n_chars": 603065, + "_n_oov_chars": 53113, + "oov_ratio": 0.08807176672497989, + "_oov_charset": "[\" \", \"拠\", \"逡\", \"O\", \"Ⅹ\", \"ウ\", \"暦\", \"罠\", \"😊\", \"黙\", \"T\", \"ば\", \"⇔\", \"ハ\", \"M\", \"Z\", \"ぉ\", \"謡\", \"詈\", \"拶\", \"ぎ\", \"◡\", \"顕\", \"🌙\", \"バ\", \"テ\", \"̈\", \"訃\", \"C\", \"ギ\", \"L\", \"T\", \"ヴ\", \"︎\", \"〟\", \"ゎ\", \"噛\", \"😌\", \"ど\", \"斉\", \"ず\", \"艸\", \"I\", \"S\", \"ド\", \"プ\", \"U\", \"H\", \"陥\", \"渓\", \"縦\", \"R\", \"贋\", \"麹\", \"ィ\", \"屓\", \"揺\", \"痩\", \"ざ\", \"V\", \"〆\", \"暁\", \"㎞\", \"惣\", \"ボ\", \"纒\", \"ヘ\", \"W\", \"\", \"G\", \"讐\", \"A\", \"ぅ\", \"ブ\", \"N\", \"\", \"挿\", \"疎\", \"で\", \"犠\", \"捜\", \"ヾ\", \"懐\", \"̀\", \"掻\", \"韮\", \"Y\", \"Y\", \"E\", \"妬\", \"レ\", \"摂\", \"リ\", \"X\", \"覗\", \"A\", \"喩\", \"兎\", \"⑪\", \"P\", \"戯\", \"´\", \"B\", \"錬\", \"◯\", \"縞\", \"K\", \"ジ\", \"ぞ\", \"ゼ\", \"袴\", \"鞄\", \"ㅂ\", \"彡\", \"捗\", \"C\", \"匂\", \"ペ\", \"Ⅶ\", \"Z\", \"D\", \"騒\", \"桟\", \"メ\", \"瘻\", \"ベ\", \"汚\", \"頬\", \"ぷ\", \"F\", \"漑\", \"ゲ\", \"ぼ\", \"✧\", \"勲\", \"P\", \"べ\", \" \", \"―\", \"R\", \"醸\", \"だ\", \"蛍\", \"パ\", \"ぶ\", \"び\", \"俵\", \"‐\", \"😢\", \"▷\", \"げ\", \"ポ\", \"⻑\", \"“\", \"猟\", \"`\", \"讃\", \"M\", \"😭\", \"N\", \"ア\", \"ガ\", \"J\", \"゚\", \"∇\", \"V\", \"ご\", \"J\", \"澪\", \"ピ\", \"遡\", \"H\", \"が\", \"ぐ\", \"ザ\", \"奨\", \"‼\", \"ゾ\", \"カ\", \"ぴ\", \"I\", \"グ\", \"剰\", \"ヨ\", \"”\", \"噂\", \"U\", \"釈\", \"贔\", \"缶\", \"巣\", \"デ\", \"W\", \"Ⅱ\", \"壌\", \"辿\", \"💦\", \"藁\", \"舘\", \"ヵ\", \"廻\", \"ズ\", \"́\", \"囁\", \"渕\", \"繍\", \"Д\", \"曽\", \"轢\", \"\\u001b\", \"​\", \"ダ\", \"砦\", \"饉\", \"呟\", \"粋\", \"穏\", \"K\", \"Q\", \"梱\", \"E\", \"娯\", \"ぱ\", \"—\", \"鋭\", \"飴\", \"゙\", \"ゥ\", \"躾\", \"鋲\", \"繰\", \"呑\", \"鉱\", \"賛\", \"ぽ\", \"拝\", \"ビ\", \"ゴ\", \"ロ\", \"じ\", \"Q\", \"鉢\", \"D\", \"謳\", \"–\", \"ぜ\", \"ゞ\", \"醤\", \"筈\", \"髭\", \"峠\", \"G\", \"渇\", \"蝋\", \"欝\", \"…\", \"’\", \"艶\", \"�\", \"酔\", \"鶏\", \"コ\", \"﨑\", \"F\", \"砕\", \"殻\", \"\\b\", \"X\", \"枠\", \"O\", \"繊\", \"B\", \"S\", \"づ\", \"簗\", \"L\"]", + "lossless": false + }, + "google-bert/bert-base-chinese @ cc100/ko": { + "tokenizer": "bert-base-chinese", + "organization": "Google", + "vocab_size": 21128, + "_n_bytes": 1524839, + "_n_tokens": 199752, + "_n_chars": 655190, + "_n_oov_chars": 495564, + "oov_ratio": 0.7563668554159863, + "_oov_charset": "[\"교\", \"백\", \"낚\", \"뵙\", \"와\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"차\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"쏭\", \"딴\", \"U\", \"튠\", \"솥\", \"접\", \"냄\", \"힘\", \"A\", \"눌\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"녀\", \"택\", \"슴\", \"퀄\", \"숟\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"ㅓ\", \"뤄\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"녜\", \"헌\", \"識\", \"숨\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"섹\", \"룩\", \"걔\", \"겉\", \"연\", \"몽\", \"L\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"첨\", \"웃\", \"💕\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"풋\", \"딛\", \"㎍\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"핀\", \"맹\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"K\", \"왓\", \"꿕\", \"헨\", \"옵\", \"팡\", \"D\", \"합\", \"싼\", \"올\", \"폐\", \"띤\", \"닙\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"테\", \"ㅎ\", \"춰\", \"볍\", \"콩\", \"리\", \"⑹\", \"탓\", \"춧\", \"悧\", \"콤\", \"박\", \"믹\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"면\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"촌\", \"팽\", \"석\", \"쿄\", \"쌈\", \"굳\", \"갉\", \"킁\", \"넉\", \"잔\", \"더\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"럽\", \"롬\", \"겔\", \"뛰\", \"틋\", \"즉\", \"캔\", \"샹\", \"‪\", \"🍔\", \"㉠\", \"존\", \"F\", \"생\", \"은\", \"훨\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"웁\", \"끗\", \"쓴\", \"썸\", \"‎\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"쁜\", \"윙\", \"셋\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"😣\", \"갯\", \"율\", \"꺼\", \"T\", \"짱\", \"둡\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"탱\", \"넵\", \"흑\", \"렁\", \"X\", \"롤\", \"꼭\", \"꿨\", \"디\", \"맡\", \"씬\", \"ㅛ\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"됐\", \"앙\", \"퍼\", \"“\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"봄\", \"뜰\", \"긋\", \"중\", \"묵\", \"컷\", \"펩\", \"턴\", \"뻤\", \"싱\", \"짠\", \"��\", \"빈\", \"맘\", \"흥\", \"앵\", \"채\", \"찍\", \"럼\", \"뭐\", \"징\", \"마\", \"혔\", \"널\", \"릉\", \"걷\", \"톡\", \"⬇\", \"뭔\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"용\", \"륜\", \"쪄\", \"덤\", \"즈\", \"돌\", \"덩\", \"왼\", \"먹\", \"I\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"폰\", \"놓\", \"많\", \"직\", \"B\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"씨\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"룰\", \"즘\", \"익\", \"씀\", \"닐\", \"멘\", \"엑\", \"념\", \"쪼\", \"돔\", \"엌\", \"헉\", \"너\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"끼\", \"롱\", \"죠\", \"낙\", \"줏\", \"옌\", \"샴\", \"봅\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"보\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"쿨\", \"뜬\", \"고\", \"췌\", \"빗\", \"무\", \"배\", \"브\", \"밧\", \"길\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"빕\", \"숍\", \"르\", \"갈\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"‬\", \"벅\", \"︎\", \"역\", \"침\", \"반\", \"쿡\", \"철\", \"쥔\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"오\", \"저\", \"닭\", \"홑\", \"방\", \"높\", \"깥\", \"울\", \"슐\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"릅\", \"跏\", \"🦄\", \"삭\", \"탁\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"촉\", \"멜\", \"쐬\", \"잃\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"픕\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"ㅝ\", \"맥\", \"력\", \"㉿\", \"돈\", \"P\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"뜩\", \"렷\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"🦅\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"세\", \"뉜\", \"임\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"아\", \"휩\", \"훗\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"체\", \"독\", \"작\", \"딪\", \"낫\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"랴\", \"쇼\", \"찢\", \"ㄹ\", \"썰\", \"덮\", \"좇\", \"밭\", \"Z\", \"◼\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"섣\", \"콥\", \"텅\", \"―\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"J\", \"목\", \"뱅\", \"퀵\", \"쏜\", \"얻\", \"몫\", \"”\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"흡\", \"놈\", \"퀴\", \"뼘\", \"민\", \"닿\", \"봐\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"경\", \"묘\", \"냉\", \"추\", \"햄\", \"🗺\", \"을\", \"책\", \"럭\", \"숲\", \"槪\", \"눔\", \"짓\", \"떄\", \"왁\", \"힙\", \"뽀\", \"원\", \"뻔\", \"펠\", \"빠\", \"😱\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"얀\", \"찰\", \"탄\", \"따\", \"앉\", \"격\", \"쿤\", \"ç\", \"곁\", \"워\", \"N\", \"층\", \"퍙\", \"끊\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"꽝\", \"➎\", \"맛\", \"점\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"값\", \"짬\", \"뻐\", \"呪\", \"流\", \"뺑\", \"뮐\", \"H\", \"움\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"쏘\", \"닥\", \"Ⅱ\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"ᴀ\", \"든\", \"풀\", \"랄\", \"딥\", \"빵\", \"씽\", \"—\", \"웹\", \"훅\", \"끄\", \"넷\", \"‘\", \"벚\", \"펑\", \"’\", \"댓\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"쏠\", \"토\", \"픽\", \"좆\", \"🔹\", \"ㅇ\", \"똥\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"한\", \"Y\", \"놔\", \"부\", \"헛\", \"밑\", \"샀\", \"샵\", \"렛\", \"훔\", \"갛\", \"쩌\", \"ㄴ\", \"유\", \"숭\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"굵\", \"끈\", \"훑\", \"싸\", \"벌\", \"W\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"뎀\", \"굽\", \"ã\", \"괜\", \"님\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"톱\", \"ㅐ\", \"춥\", \"털\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"금\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"객\", \"덕\", \"믐\", \"았\", \"귈\", \"듭\", \"베\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"–\", \"킵\", \"짤\", \"챌\", \"권\", \"색\", \"찾\", \"션\", \"혀\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"천\", \"짧\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"⁴\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"♧\", \"문\", \"🙌\", \"러\", \"ɪ\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"코\", \"뒀\", \"쒀\", \"상\", \"즌\", \"ㅘ\", \"닳\", \"척\", \"낱\", \"랑\", \"떼\", \"얼\", \"청\", \"씩\", \"앱\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"팎\", \"슷\", \"쩍\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"카\", \"혹\", \"치\", \"핍\", \"칸\", \"잴\", \"꾀\", \"둬\", \"여\", \"손\", \"V\", \"인\", \"픈\", \"앤\", \"ㅅ\", \"횟\", \"쁠\", \"앓\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"쳐\", \"업\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"섦\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"벽\", \"기\", \"↕\", \"자\", \"쌩\", \"`\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"슛\", \"섯\", \"걸\", \"불\", \"품\", \"찌\", \"Q\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"찼\", \"조\", \"O\", \"․\", \"쩡\", \"참\", \"섭\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"땠\", \"칵\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"콜\", \"딤\", \"겁\", \"숱\", \"Ⅶ\", \"빛\", \"켤\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"텐\", \"▷\", \"스\", \"턱\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"쇠\", \"🍎\", \"클\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"​\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"가\", \"셀\", \"키\", \"갇\", \"걍\", \"不\", \"멈\", \"S\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"챨\", \"샘\", \"­\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"최\", \"쨌\", \"몬\", \"찮\", \"龍\", \"슬\", \"쟁\", \"븐\", \"흗\", \"톤\", \"양\", \"G\", \"핫\", \"셔\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"비\", \"C\", \"눕\", \"젊\", \"뀔\", \"R\", \" \", \"않\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"밉\", \"캣\", \"겨\", \"뭇\", \"던\", \"���\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"범\", \"절\", \"낀\", \"볕\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"파\", \"밥\", \"멀\", \"폍\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"넓\", \"쉬\", \"먼\", \"붙\", \"쟤\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"희\", \"크\", \"제\", \"패\", \"할\", \"현\", \"전\", \"선\", \"㉣\", \"셉\", \"췄\", \"왘\", \"ㅡ\", \"쑥\", \"❍\", \"릭\", \"켓\", \"요\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"‍\", \"친\", \"맷\", \"쯔\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"M\", \"칩\", \"켐\", \"빔\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"는\", \"줍\", \"핥\", \"낼\", \"ㅞ\", \"딸\", \"압\", \"죤\", \"덧\", \"모\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"E\", \"획\", \"도\", \"쥐\", \"뻗\", \"외\", \"종\", \"☎\", \"…\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\"]", + "lossless": false + }, + "google-bert/bert-base-german-cased @ cc100/ar": { + "tokenizer": "bert-base-german-cased", + "organization": "Google", + "vocab_size": 30000, + "_n_bytes": 2813283, + "_n_tokens": 310312, + "_n_chars": 1560987, + "_n_oov_chars": 1361552, + "oov_ratio": 0.87223788538918, + "_oov_charset": "[\" \", \"α\", \"â\", \"ﷺ\", \"ﻻ\", \"😊\", \"٦\", \"۲\", \"ع\", \"ί\", \"ذ\", \"ﻹ\", \"
\", \"۷\", \"▪\", \"٩\", \"‹\", \"ي\", \"۸\", \"د\", \"٣\", \"à\", \"ى\", \"ة\", \"ن\", \"ب\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"غ\", \"¡\", \"۰\", \"ط\", \"ء\", \"é\", \"،\", \"٪\", \"ۚ\", \"😀\", \"چ\", \"ك\", \"♥\", \"«\", \"κ\", \"ۗ\", \"½\", \"ٹ\", \"ظ\", \"‏\", \"🙂\", \"ک\", \"χ\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"×\", \"←\", \"إ\", \"ٰ\", \"َ\", \"ئ\", \"ْ\", \"›\", \"٠\", \"»\", \"τ\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"μ\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"▫\", \"ُ\", \"“\", \"ِ\", \"٧\", \"؟\", \"Х\", \"ٱ\", \"‎\", \"η\", \"″\", \"ث\", \"”\", \"ρ\", \"©\", \"ή\", \"ﻷ\", \"•\", \"ل\", \"​\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"®\", \"ص\", \"ؤ\", \"‌\", \"—\", \"م\", \"‬\", \"ر\", \"ا\", \"س\", \"–\", \"ق\", \"﴿\", \"ه\", \"‘\", \"…\", \"�\", \"’\", \"ف\", \"؛\", \"█\", \"ھ\", \"و\", \"\"]", + "lossless": false + }, + "google-bert/bert-base-german-cased @ cc100/de": { + "tokenizer": "bert-base-german-cased", + "organization": "Google", + "vocab_size": 30000, + "_n_bytes": 1814876, + "_n_tokens": 384241, + "_n_chars": 1784021, + "_n_oov_chars": 3522, + "oov_ratio": 0.0019741920078295045, + "_oov_charset": "[\"α\", \"â\", \"\", \"ó\", \"‚\", \"→\", \"–\", \"Ã\", \"▼\", \"­\", \" \", \"ί\", \"Á\", \"̈\", \"™\", \"¼\", \"„\", \"‹\", \"à\", \"å\", \"á\", \"ς\", \"É\", \"¶\", \"œ\", \"♡\", \"ú\", \"≠\", \"ā\", \"ớ\", \"¤\", \"é\", \"ç\", \"😀\", \"♥\", \"🙁\", \"«\", \"😂\", \"ε\", \"ï\", \"😃\", \"½\", \"🙂\", \"❤\", \"ư\", \"´\", \"😉\", \"Ø\", \"↑\", \"·\", \"›\", \"😈\", \"»\", \"τ\", \"↩\", \"ć\", \"‐\", \"😢\", \"„\", \"ô\", \"“\", \"¬\", \"★\", \"£\", \"û\", \"−\", \"š\", \"‎\", \"İ\", \"ø\", \"”\", \"¹\", \"ė\", \"Ÿ\", \"‽\", \"ρ\", \"è\", \"➔\", \"©\", \"😦\", \"•\", \"ß\", \"ι\", \"​\", \"q\", \"☺\", \"č\", \"—\", \"°\", \"“\", \"ń\", \"😆\", \"–\", \"♦\", \"¿\", \"‘\", \"…\", \"’\", \"�\", \"²\", \"🙄\"]", + "lossless": false + }, + "google-bert/bert-base-german-cased @ cc100/fa": { + "tokenizer": "bert-base-german-cased", + "organization": "Google", + "vocab_size": 30000, + "_n_bytes": 2054052, + "_n_tokens": 254518, + "_n_chars": 1145876, + "_n_oov_chars": 1029578, + "oov_ratio": 0.8985073428538516, + "_oov_charset": "[\" \", \"۲\", \"ع\", \"­\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"ي\", \"۱\", \"د\", \"۸\", \"٣\", \"ى\", \"ة\", \"ۀ\", \"ن\", \"◄\", \"ب\", \"پ\", \"●\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"غ\", \"۰\", \"ء\", \"ط\", \"✿\", \"،\", \"٪\", \"چ\", \"ك\", \"۔\", \"♥\", \"ט\", \"«\", \"ڪ\", \"ے\", \"ظ\", \"‏\", \"❤\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"×\", \"ٌ\", \"ﮧ\", \"۴\", \"إ\", \"ּ\", \"َ\", \"ئ\", \"·\", \"ْ\", \"›\", \"٠\", \"»\", \"٫\", \"‍\", \"ج\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"“\", \"★\", \"ٴ\", \"ِ\", \"٧\", \"؟\", \"‎\", \"ث\", \"”\", \"۵\", \"▐\", \"©\", \"•\", \"ل\", \"️\", \"​\", \"٨\", \"٤\", \"q\", \"١\", \"ت\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"۹\", \"ؤ\", \"‌\", \"م\", \"ر\", \"ا\", \"س\", \"–\", \"ق\", \"ه\", \"‘\", \"…\", \"�\", \"’\", \"ف\", \"؛\", \"ھ\", \"گ\", \"و\", \"\"]", + "lossless": false + }, + "google-bert/bert-base-german-cased @ cc100/ja": { + "tokenizer": "bert-base-german-cased", + "organization": "Google", + "vocab_size": 30000, + "_n_bytes": 1774770, + "_n_tokens": 318073, + "_n_chars": 603065, + "_n_oov_chars": 586458, + "oov_ratio": 0.972462338222248, + "_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"帝\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"合\", \"暴\", \"之\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"林\", \"循\", \"喚\", \"惨\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"夫\", \"草\", \"憶\", \"截\", \"侶\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"事\", \"護\", \"点\", \"法\", \"眠\", \"狭\", \"鎌\", \"ツ\", \"腫\", \"ゼ\", \"歌\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"シ\", \"曹\", \"開\", \"恰\", \"ぷ\", \"心\", \"段\", \"捉\", \"れ\", \"送\", \"浩\", \"邸\", \"琢\", \"力\", \"隆\", \"朝\", \"伊\", \"た\", \"疾\", \"串\", \"笛\", \"星\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"北\", \"虐\", \"騰\", \"捐\", \"塵\", \"滲\", \"和\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"©\", \"•\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"貴\", \"珍\", \"〜\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"清\", \"家\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"陸\", \"亜\", \"f\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"尚\", \"倭\", \"表\", \"圃\", \"→\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"〉\", \"可\", \"章\", \"杉\", \"氷\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"道\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"に\", \"冷\", \"強\", \"壇\", \"祠\", \"五\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"史\", \"ゆ\", \"泣\", \"候\", \"米\", \"勤\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"手\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \",\", \"必\", \"蛍\", \"材\", \"跨\", \"場\", \"胞\", \"潜\", \"猟\", \"★\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"陽\", \"汁\", \"塔\", \"鍋\", \"妻\", \"″\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"立\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"同\", \"楓\", \"妊\", \"徳\", \"ろ\", \"悔\", \"抱\", \"剃\", \"版\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"年\", \"見\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"我\", \"促\", \"膚\", \"亀\", \"嘘\", \"脳\", \"卑\", \"正\", \"Z\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"信\", \"役\", \"0\", \"稚\", \"嗅\", \"臨\", \"奮\", \"羊\", \"木\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"介\", \"収\", \"略\", \"斬\", \"村\", \"爪\", \"媒\", \"猿\", \"変\", \"公\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"李\", \"城\", \"競\", \"々\", \"群\", \"ナ\", \"救\", \"覗\", \"羅\", \"東\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"語\", \"飢\", \"腺\", \"漑\", \"て\", \"署\", \"塾\", \"募\", \"タ\", \"」\", \"チ\", \"掬\", \"律\", \"床\", \"狩\", \"子\", \"号\", \"愛\", \"奔\", \"ア\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"́\", \"綬\", \"端\", \"三\", \"秤\", \"魂\", \"建\", \"輿\", \"ウ\", \"駆\", \"[\", \"ぬ\", \"遂\", \"鮮\", \"粋\", \"想\", \"®\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"ら\", \"延\", \"飼\", \"模\", \"お\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"レ\", \"特\", \"貰\", \"払\", \"放\", \"叉\", \"博\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"⇒\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"を\", \"成\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"真\", \"坂\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"食\", \"レ\", \"懸\", \"久\", \"睡\", \"喩\", \"嵐\", \"井\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"口\", \"空\", \"往\", \"票\", \"・\", \"団\", \"涅\", \"止\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"マ\", \"覆\", \"崩\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"安\", \"舟\", \"パ\", \"告\", \"詰\", \"画\", \"爾\", \"昭\", \"豚\", \"釣\", \"“\", \"紫\", \"謬\", \"悪\", \"橋\", \"試\", \"孫\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"テ\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"風\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"q\", \"洋\", \"精\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"-\", \"糸\", \"の\", \"面\", \"輝\", \"校\", \"等\", \"達\", \"光\", \"勿\", \"欣\", \"迦\", \"み\", \"社\", \" \", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"宿\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"英\", \"赤\", \"努\", \"ま\", \"文\", \"効\", \"応\", \"%\", \"習\", \"こ\", \"プ\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"福\", \"躇\", \"鈴\", \"誇\", \"ひ\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"な\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"保\", \"頂\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"青\", \"恣\", \"碓\", \"梶\", \"水\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \":\", \"棟\", \"退\", \"叫\", \"ね\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"戦\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"主\", \"礼\", \"賀\", \"揄\", \"膜\", \"ニ\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"岡\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"セ\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"え\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"世\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"民\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"国\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"西\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"や\", \"‐\", \"都\", \"阿\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"∇\", \"屋\", \"関\", \"フ\", \"ピ\", \"彷\", \"優\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"〈\", \"》\", \"親\", \"翔\", \"垣\", \"永\", \"痢\", \"方\", \"張\", \"粒\", \"香\", \"絡\", \"乱\", \"紛\", \"揉\", \")\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"曲\", \"は\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"鹿\", \"寄\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"松\", \"冒\", \"措\", \"雄\", \"國\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"、\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"有\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"四\", \"ノ\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"田\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"»\", \"股\", \"閲\", \"乳\", \"勝\", \"拘\", \"幡\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"出\", \"範\", \"斡\", \"太\", \"街\", \"不\", \"様\", \"噂\", \"健\", \"景\", \"宮\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"行\", \"施\", \"惧\", \"痺\", \"キ\", \"巨\", \".\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"凡\", \"注\", \"足\", \"繰\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"古\", \"磋\", \"椒\", \"慈\", \"州\", \"判\", \"酔\", \"杜\", \"悟\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"ー\", \"羽\", \"裏\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"定\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"門\", \"科\", \"贅\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"吉\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"名\", \"■\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"´\", \"ェ\", \"ジ\", \"脅\", \"ぁ\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"谷\", \"砂\", \"密\", \"闘\", \"✧\", \"―\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"幸\", \"神\", \"呂\", \"ほ\", \"V\", \"ご\", \"山\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"発\", \"”\", \"薄\", \"率\", \"稲\", \"U\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"軍\", \"映\", \"補\", \"京\", \"婿\", \"工\", \"へ\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"里\", \"幼\", \"繋\", \"内\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"女\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"け\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"比\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"カ\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"金\", \"落\", \"※\", \"使\", \"書\", \"守\", \"漱\", \"●\", \"泊\", \"編\", \"龍\", \"遊\", \"尊\", \"典\", \"W\", \"治\", \"ブ\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"«\", \"勢\", \"石\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"火\", \"←\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"忠\", \"膝\", \"捗\", \"批\", \"滅\", \"沢\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"相\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"氏\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"地\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"響\", \"己\", \"敏\", \"貝\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"美\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"稼\", \"末\", \"耳\", \"\\u001b\", \"漢\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"—\", \"滓\", \"5\", \"盆\", \"い\", \"目\", \"没\", \"呑\", \"仮\", \"需\", \"善\", \"闊\", \"肉\", \"D\", \"省\", \"秀\", \"押\", \"墓\", \"蝋\", \"揃\", \"ケ\", \"壮\", \"ω\", \"’\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"武\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"本\", \"戒\", \"バ\", \"債\", \"磯\", \"』\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"匡\", \"ワ\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"陳\", \"配\", \"付\", \"纒\", \"袈\", \"十\", \"��\", \"『\", \"日\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"す\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"高\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"ち\", \"短\", \"ぼ\", \"択\", \"届\", \"μ\", \"篇\", \"藤\", \"大\", \"晋\", \"旋\", \"ポ\", \"土\", \"代\", \"士\", \"=\", \"誉\", \"め\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"デ\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"楊\", \"順\", \"匠\", \"月\", \"栃\", \"耗\", \"ダ\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"ュ\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"ン\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"劉\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"天\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"ド\", \"眺\", \"企\", \"県\", \"児\", \"奈\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"掲\", \"併\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"宗\", \"懇\", \"午\", \"e\", \"×\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"野\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"オ\", \"趨\", \"h\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"「\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"二\", \"区\", \"楚\", \"ア\", \"ト\", \"る\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"¥\", \"体\", \"解\", \"【\", \"勘\", \"良\", \"雇\", \"訴\", \"吸\", \"身\", \"犬\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"ィ\", \"花\", \"望\", \"紙\", \"尿\", \"庭\", \"ロ\", \"母\", \"線\", \"–\", \"遇\", \"漠\", \"離\", \"貿\", \"河\", \"示\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"馬\", \"倉\", \"昧\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"☆\", \"暖\", \"序\", \"宇\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"中\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"原\", \"帰\", \"g\", \"幽\", \"車\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"も\", \"敷\", \"丈\", \"堵\", \"ホ\", \"弓\", \"逢\", \"ム\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"也\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"↑\", \"幣\", \"徨\", \"下\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"秋\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"人\", \"《\", \"郎\", \"牛\", \"広\", \"化\", \"掃\", \"う\", \"自\", \"父\", \"銀\", \"王\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"部\", \"−\", \"設\", \"─\", \"昨\", \"ん\", \"屈\", \"蹴\", \"海\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"ズ\", \"幅\", \"臆\", \"轢\", \"異\", \"八\", \"ハ\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"戸\", \"憂\", \"佐\", \"炎\", \"伐\", \"迫\", \"筈\", \"寂\", \"つ\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"後\", \"改\", \"塞\", \"狐\", \"و\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"イ\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"サ\", \"業\", \"甲\", \"拙\", \"謗\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"モ\", \"長\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"よ\", \"功\", \"岬\", \"上\", \"丹\", \"ぞ\", \"経\", \"御\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"。\", \"崎\", \"険\", \"色\", \"姉\", \"傷\", \"白\", \"細\", \"囲\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"新\", \"記\", \"幕\", \"航\", \"あ\", \"肌\", \"溢\", \"グ\", \"並\", \"筋\", \"哲\", \"ヒ\", \"贈\", \"ユ\", \"稜\", \"全\", \"そ\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"皇\", \"ル\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"春\", \"歳\", \"く\", \"旗\", \"り\", \"苑\", \"聾\", \"観\", \"殊\", \"(\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"ふ\", \"ヘ\", \"冨\", \"~\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"前\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"B\", \"寺\", \"糞\", \"暗\", \"的\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"β\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"ッ\", \"墜\", \"簡\", \"っ\", \"彿\", \"加\", \"分\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"コ\", \"郡\", \"舗\", \"淫\", \"暁\", \"ボ\", \"ミ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"一\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"メ\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"せ\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"?\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"堂\", \"捧\", \"片\", \"釜\", \"ガ\", \"撮\", \"b\", \"間\", \"極\", \"棚\", \"華\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"宣\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"仁\", \"​\", \"/\", \"綻\", \"芸\", \"ス\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"し\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"↓\", \"「\", \"冬\", \"コ\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"凶\", \"警\", \"能\", \"_\", \"更\", \"姑\", \"森\", \"怠\", \"川\", \"擬\", \"媚\", \"義\", \"非\", \"駅\", \"供\", \"霧\", \"南\", \"癌\", \"ャ\", \"座\", \"居\", \"篤\", \"推\", \"駐\", \"志\", \"宜\", \"穫\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"き\", \"曰\", \"讐\", \"ク\", \"鱈\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"寛\", \"底\", \"墳\", \"鈍\", \"沖\", \"さ\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"島\", \"ε\", \"尺\", \"職\", \"烹\", \"会\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"ラ\", \"蔑\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"平\", \"遍\", \"男\", \"$\", \"髪\", \" \", \"政\", \"縄\", \"か\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"元\", \"沈\", \"任\", \"壌\", \"馳\", \"ョ\", \"ヵ\", \"督\", \"燥\", \"侍\", \"餓\", \"リ\", \"簿\", \"葉\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"江\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"生\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"ロ\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"」\", \"理\", \"!\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"外\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"司\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"む\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"夏\", \"智\", \"晴\", \"頬\", \"汚\", \"学\", \"揶\", \"起\", \"番\", \"洒\", \"竹\", \"欽\", \"明\", \"累\", \"破\", \"ァ\", \"讃\", \"瀬\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"千\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"樹\", \"楼\", \"始\", \"エ\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"と\", \"雅\", \"評\", \"現\", \"Д\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"小\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"…\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]", + "lossless": false + }, + "google-bert/bert-base-german-cased @ cc100/ko": { + "tokenizer": "bert-base-german-cased", + "organization": "Google", + "vocab_size": 30000, + "_n_bytes": 1524839, + "_n_tokens": 203846, + "_n_chars": 655190, + "_n_oov_chars": 490211, + "oov_ratio": 0.7481967062989362, + "_oov_charset": "[\"교\", \"帝\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"合\", \"차\", \"之\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"林\", \"쏭\", \"딴\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"事\", \"法\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"心\", \"켜\", \"◐\", \"朝\", \"ㅓ\", \"✈\", \"星\", \"友\", \"뤄\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"北\", \"和\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"©\", \"•\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"家\", \"몽\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"→\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"章\", \"〉\", \"可\", \"💕\", \"氷\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"道\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"♥\", \"五\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"史\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"왓\", \"꿕\", \"歲\", \"헨\", \"·\", \"👍\", \"옵\", \"팡\", \"詠\", \"합\", \"싼\", \"述\", \"올\", \"手\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"★\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"陽\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"¹\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"立\", \"콩\", \"리\", \"⑹\", \"說\", \"同\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"將\", \"날\", \"입\", \"못\", \"났\", \"年\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"正\", \"🙋\", \"튿\", \"끔\", \"適\", \"信\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"公\", \"굳\", \"辰\", \"갉\", \"쌈\", \"劍\", \"킁\", \"넉\", \"잔\", \"더\", \"▲\", \"城\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"東\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"‪\", \"🍔\", \"語\", \"㉠\", \"존\", \"생\", \"은\", \"훨\", \"て\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"子\", \"愛\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"‎\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"三\", \"윙\", \"셋\", \"鮮\", \"엄\", \"®\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"²\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"⇒\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"食\", \"렁\", \"롤\", \"꼭\", \"꿨\", \"디\", \"口\", \"實\", \"맡\", \"・\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"安\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"昭\", \"됐\", \"앙\", \"퍼\", \"“\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"面\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"光\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"社\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"英\", \"덩\", \"왼\", \"文\", \"먹\", \"%\", \"♣\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"福\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"›\", \"水\", \"씨\", \"없\", \"컵\", \":\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"主\", \"닐\", \"⑸\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"世\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"民\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"〈\", \"》\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"永\", \"샐\", \"같\", \"方\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"‬\", \"벅\", \"︎\", \"역\", \"は\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"國\", \"릅\", \"雄\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"有\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"»\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"出\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"不\", \"🦅\", \"宮\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"行\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"古\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"門\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"■\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"德\", \"덮\", \"좇\", \"밭\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"谷\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"―\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"목\", \"神\", \"£\", \"山\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"”\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"軍\", \"흡\", \"놈\", \"퀴\", \"京\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"里\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"女\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"⋅\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"比\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"↔\", \"樺\", \"펠\", \"빠\", \"😱\", \"金\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"書\", \"守\", \"∙\", \"얀\", \"●\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"龍\", \"격\", \"典\", \"쿤\", \"治\", \"ç\", \"곁\", \"워\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"火\", \"←\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"相\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"地\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"美\", \"Ⅱ\", \"投\", \"奉\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"漢\", \"든\", \"ᴀ\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"—\", \"웹\", \"°\", \"い\", \"目\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"‘\", \"ω\", \"벚\", \"펑\", \"’\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"武\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"』\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"陳\", \"쏠\", \"토\", \"픽\", \"좆\", \"十\", \"『\", \"日\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"±\", \"한\", \"놔\", \"′\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"す\", \"⑧\", \"렛\", \"□\", \"高\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"μ\", \"맞\", \"大\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"土\", \"代\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"月\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"客\", \"師\", \"臀\", \"α\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"天\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"宗\", \"객\", \"덕\", \"邦\", \"×\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"野\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"「\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"犬\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"–\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"☆\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"中\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"原\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"⁴\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"ɪ\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"↑\", \"간\", \"下\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"秋\", \"至\", \"상\", \"즌\", \"魯\", \"人\", \"《\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"王\", \"척\", \"낱\", \"랑\", \"射\", \"部\", \"떼\", \"얼\", \"海\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"八\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"後\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"長\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"上\", \"국\", \"쌀\", \"샬\", \"≤\", \"뚜\", \"御\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"。\", \"자\", \"色\", \"白\", \"쌩\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"新\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"そ\", \"쫒\", \"밌\", \"건\", \"콕\", \"皇\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"春\", \"불\", \"품\", \"찌\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"的\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"分\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"一\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"?\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"堂\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"間\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"뇌\", \"득\", \"투\", \"㈜\", \"賣\", \"쇠\", \"華\", \"클\", \"🍎\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"​\", \"仁\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"し\", \"↓\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"­\", \"각\", \"갓\", \"川\", \"랭\", \"옥\", \"엮\", \"펴\", \"南\", \"居\", \"駐\", \"志\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"눕\", \"젊\", \"平\", \"男\", \"뀔\", \" \", \"政\", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"江\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"生\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"」\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"外\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"‍\", \"친\", \"맷\", \"쯔\", \"濁\", \"竹\", \"明\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"樹\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"…\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]", + "lossless": false + }, + "google-bert/bert-base-multilingual-cased @ cc100/ar": { + "tokenizer": "bert-base-multilingual-cased", + "organization": "Google", + "vocab_size": 119547, + "_n_bytes": 2813283, + "_n_tokens": 627501, + "_n_chars": 1560987, + "_n_oov_chars": 1800, + "oov_ratio": 0.0011531165858524126, + "_oov_charset": "[\"ﻷ\", \"↩\", \"​\", \"٨\", \"ۖ\", \"ۚ\", \"ﻻ\", \"😀\", \"😊\", \"٦\", \"ۤ\", \"▫\", \"“\", \"ﻹ\", \"ۗ\", \"‌\", \"—\", \"
\", \"‏\", \"🙂\", \"‬\", \"٧\", \"–\", \"ٱ\", \"‎\", \"‘\", \"⤴\", \"”\", \"…\", \"�\", \"’\", \"\"]", + "lossless": false + }, + "google-bert/bert-base-multilingual-cased @ cc100/de": { + "tokenizer": "bert-base-multilingual-cased", + "organization": "Google", + "vocab_size": 119547, + "_n_bytes": 1814876, + "_n_tokens": 445764, + "_n_chars": 1784021, + "_n_oov_chars": 2205, + "oov_ratio": 0.0012359719980874664, + "_oov_charset": "[\"😦\", \"↩\", \"​\", \"\", \"☺\", \"😀\", \"‐\", \"–\", \"😢\", \"­\", \"🙁\", \" \", \"😂\", \"“\", \"`\", \"̈\", \"😃\", \"—\", \"“\", \"🙂\", \"❤\", \"„\", \"😆\", \"–\", \"‎\", \"´\", \"😉\", \"‘\", \"”\", \"…\", \"’\", \"�\", \"Ÿ\", \"‽\", \"😈\", \"🙄\", \"¤\", \"➔\"]", + "lossless": false + }, + "google-bert/bert-base-multilingual-cased @ cc100/fa": { + "tokenizer": "bert-base-multilingual-cased", + "organization": "Google", + "vocab_size": 119547, + "_n_bytes": 2054052, + "_n_tokens": 400799, + "_n_chars": 1145876, + "_n_oov_chars": 8034, + "oov_ratio": 0.007011229836387183, + "_oov_charset": "[\"️\", \"​\", \"٨\", \"­\", \"“\", \"ڪ\", \"‌\", \"ٴ\", \"‏\", \"❤\", \"٧\", \"–\", \"ﮧ\", \"‎\", \"◄\", \"‘\", \"”\", \"…\", \"�\", \"’\", \"▐\", \"✿\", \"‍\", \"\"]", + "lossless": false + }, + "google-bert/bert-base-multilingual-cased @ cc100/ja": { + "tokenizer": "bert-base-multilingual-cased", + "organization": "Google", + "vocab_size": 119547, + "_n_bytes": 1774770, + "_n_tokens": 469446, + "_n_chars": 603065, + "_n_oov_chars": 2029, + "oov_ratio": 0.0033644797824446786, + "_oov_charset": "[\"¥\", \"逡\", \"O\", \"a\", \"Ⅹ\", \"ウ\", \"😊\", \"ハ\", \"Z\", \"ぉ\", \"d\", \"詈\", \"🌙\", \"テ\", \"̈\", \"L\", \"T\", \"〟\", \"ゎ\", \"😌\", \"艸\", \"g\", \"H\", \"R\", \"ィ\", \"`\", \"屓\", \"i\", \"〆\", \"^\", \"纒\", \"㎞\", \"ヽ\", \"ヘ\", \"⑩\", \"W\", \"t\", \"\", \"ぅ\", \"\", \"o\", \"ヾ\", \"丿\", \"Y\", \"E\", \"レ\", \"❤\", \"リ\", \"頷\", \" ̄\", \"P\", \"⑪\", \"e\", \"⑧\", \"´\", \"◯\", \"ㅂ\", \"Ⅶ\", \"ー\", \"メ\", \"m\", \"瘻\", \"h\", \"嚥\", \"✧\", \"$\", \" \", \"―\", \"▽\", \"‐\", \"😢\", \"▷\", \"⻑\", \"“\", \"`\", \"y\", \"😭\", \"ア\", \"N\", \"゚\", \"b\", \"V\", \"J\", \"噤\", \"‼\", \"✨\", \"カ\", \"r\", \"I\", \"ヨ\", \"”\", \"U\", \"贔\", \"k\", \"💦\", \"゙\", \"\\u001b\", \"​\", \"K\", \"w\", \"—\", \"ノ\", \"゙\", \"ゥ\", \"躾\", \"鋲\", \"彡\", \"n\", \"ロ\", \"︎\", \"フ\", \"Q\", \"D\", \"–\", \"G\", \"欝\", \"…\", \"’\", \"�\", \"♫\", \"コ\", \"l\", \"F\", \"゚\", \"\\b\", \"s\", \"⌒\", \"f\"]", + "lossless": false + }, + "google-bert/bert-base-multilingual-cased @ cc100/ko": { + "tokenizer": "bert-base-multilingual-cased", + "organization": "Google", + "vocab_size": 119547, + "_n_bytes": 1524839, + "_n_tokens": 427953, + "_n_chars": 655190, + "_n_oov_chars": 5121, + "oov_ratio": 0.007816053358567743, + "_oov_charset": "[\" \", \"ᴇ\", \"떄\", \"낚\", \"왁\", \"뵙\", \"💡\", \"듐\", \"뽀\", \"金\", \"롸\", \"璣\", \"🤭\", \"쎄\", \"❏\", \"욜\", \"쪄\", \"😱\", \"ⅰ\", \"잴\", \"💰\", \"쏭\", \"⑨\", \"✔\", \"둬\", \"솥\", \"짚\", \"㎞\", \"ㅅ\", \"쁠\", \"깅\", \"v\", \"꿍\", \"퍙\", \"팰\", \"꽉\", \"궈\", \"퀄\", \"숟\", \"㉰\", \"퓰\", \"➊\", \"웍\", \"꽝\", \"➎\", \"㎥\", \"ⅲ\", \"섦\", \"튄\", \"🤗\", \"ᴡ\", \"잼\", \"뵐\", \"뺏\", \"짢\", \"🥁\", \"����\", \"똘\", \"Ⅷ\", \"↕\", \"◐\", \"ㅓ\", \"✈\", \"쌩\", \"☞\", \"`\", \"ㅢ\", \"폄\", \"볶\", \"짬\", \"삣\", \"뭘\", \"流\", \"뺑\", \"뮐\", \"쫀\", \"⑸\", \"귤\", \"즙\", \"쿰\", \"쪼\", \"눴\", \"💦\", \"엌\", \"쫒\", \"밌\", \"헉\", \"뺐\", \"띈\", \"녜\", \"ㅔ\", \"ᴀ\", \"ㅑ\", \"識\", \"뛸\", \"샷\", \"▒\", \"씽\", \"—\", \"퍽\", \"🍕\", \"쩐\", \"훅\", \"잤\", \"Ⅸ\", \"걔\", \"\", \"\", \"👨\", \"맬\", \"얍\", \"ㅆ\", \"‘\", \"믄\", \"�\", \"’\", \"찼\", \"꽁\", \"쩡\", \"뜯\", \"\", \"⚀\", \"ㅕ\", \"🙆\", \"꺄\", \"뱉\", \"줏\", \"앰\", \"숏\", \"샴\", \"💕\", \"썹\", \"봅\", \"🍟\", \"꿰\", \"◈\", \"렜\", \"땠\", \"읊\", \"빡\", \"칵\", \"핏\", \"빳\", \"🚨\", \"뱃\", \"◦\", \"띕\", \"🍰\", \"∮\", \"💌\", \"쏠\", \"숯\", \"딛\", \"좆\", \"㎍\", \"🔹\", \"ㅇ\", \"똥\", \"갭\", \"덥\", \"욥\", \"딤\", \"😂\", \"쌉\", \"➋\", \"놔\", \"밧\", \"헛\", \"◑\", \"쓕\", \"껑\", \"쭙\", \"땀\", \"샵\", \"휙\", \"ㅗ\", \"⑧\", \"💣\", \"숱\", \"꿕\", \"㎡\", \"ᴏ\", \"Ⅶ\", \"갛\", \"켤\", \"👍\", \"ㄴ\", \"뿍\", \"⑥\", \"닙\", \"긁\", \"卽\", \"▷\", \"팹\", \"ㄱ\", \"ㅣ\", \"🌿\", \"봬\", \"굶\", \"㈜\", \"💸\", \"🍎\", \"🚿\", \"훑\", \"쬐\", \"촘\", \"綃\", \"빕\", \"뿜\", \"ㅋ\", \"빤\", \"💥\", \"칫\", \"됬\", \"땐\", \"ㅎ\", \"️\", \"​\", \"◾\", \"씹\", \"츈\", \"끽\", \"Ⅴ\", \"놨\", \"⑹\", \"춧\", \"悧\", \"➍\", \"‬\", \"ⅱ\", \"︎\", \"ᴄ\", \"쫗\", \"쥔\", \"걍\", \"不\", \"😗\", \"뎀\", \"⑴\", \"쳇\", \"쵸\", \"Ⅹ\", \"툭\", \"큽\", \"뮈\", \"🍭\", \"홑\", \"챨\", \"­\", \"ㅁ\", \"良\", \"🙋\", \"🏻\", \"튿\", \"뗀\", \"쨍\", \"⑦\", \"⑶\", \"ㅐ\", \"춥\", \"낍\", \"쨌\", \"ㅜ\", \"댔\", \"꺽\", \"삐\", \"龍\", \"릅\", \"跏\", \"🦄\", \"흗\", \"☀\", \"▶\", \"틔\", \"끙\", \"🤔\", \"팥\", \"갉\", \"쉼\", \"쌈\", \"킁\", \"🏫\", \"넉\", \"뜹\", \"㏊\", \"쐬\", \"ㅍ\", \"짊\", \"깡\", \"累\", \"쾨\", \"🤟\", \"흠\", \"셌\", \"틋\", \"믐\", \"픕\", \"귈\", \"ⓒ\", \"ⓔ\", \"넹\", \"눕\", \"‪\", \"🍔\", \"텨\", \"잖\", \"삘\", \"㉠\", \"ʏ\", \"뜸\", \"ㅝ\", \"㉿\", \"ㅟ\", \"떴\", \"뀔\", \"ʟ\", \" \", \"🤕\", \"짖\", \"女\", \"텁\", \"뾱\", \"理\", \"떳\", \"쏙\", \"냅\", \"樂\", \"立\", \"웁\", \"껀\", \"팠\", \"뜩\", \"밉\", \"잣\", \"썸\", \"‎\", \"ㅖ\", \"🌳\", \"흄\", \"솨\", \"🦅\", \"힉\", \"썅\", \"樂\", \"땡\", \"왠\", \"볕\", \"엎\", \"梁\", \"댁\", \"Ⅵ\", \"얏\", \"냠\", \"챗\", \"쾅\", \"💅\", \"ㅚ\", \"飮\", \"–\", \"맙\", \"킵\", \"짤\", \"녘\", \"뭥\", \"씻\", \"폿\", \"➏\", \"ⅳ\", \"폈\", \"폍\", \"😣\", \"😊\", \"둡\", \"ᴍ\", \"쉘\", \"맴\", \"잰\", \"➌\", \"뛴\", \"탰\", \"쟤\", \"ㅈ\", \"앎\", \"킌\", \"趺\", \"〮\", \"훠\", \"🏷\", \"뎅\", \"궜\", \"쿵\", \"퀀\", \"▣\", \"🌵\", \"깽\", \"젓\", \"ᴛ\", \"벙\", \"ㅒ\", \"♧\", \"㉣\", \"췄\", \"꽂\", \"왘\", \"🙌\", \"◀\", \"ㅡ\", \"뺀\", \"쑥\", \"힜\", \"❍\", \"엡\", \"넵\", \"❤\", \"찢\", \"뽐\", \"ㄹ\", \"쫄\", \"ㅙ\", \"됩\", \"캇\", \"뻑\", \"좇\", \"◼\", \"ㅛ\", \"쉰\", \"🙇\", \"‍\", \"쎈\", \"靈\", \"섣\", \"텅\", \"쭈\", \"―\", \"찜\", \"쒀\", \"꿇\", \"슝\", \"⑵\", \"쐐\", \"“\", \"ㄷ\", \"ㅏ\", \"😭\", \"ㅘ\", \"닳\", \"돠\", \"켐\", \"뜰\", \"쫑\", \"펩\", \"핥\", \"줍\", \"퀵\", \"”\", \"ㅞ\", \"빴\", \"👋\", \"뻤\", \"짠\", \"♤\", \"ㅠ\", \"죤\", \"뼘\", \"陸\", \"웖\", \"짭\", \"푹\", \"ㅊ\", \"팁\", \"켠\", \"☎\", \"🗺\", \"⬇\", \"…\", \"팎\", \"🍞\", \"槪\", \"s\", \"쩍\", \"눔\"]", + "lossless": false + }, + "google-bert/bert-base-multilingual-uncased @ cc100/ar": { + "tokenizer": "bert-base-multilingual-uncased", + "organization": "Google", + "vocab_size": 105879, + "_n_bytes": 2813283, + "_n_tokens": 586110, + "_n_chars": 1560987, + "_n_oov_chars": 71436, + "oov_ratio": 0.045763353570529415, + "_oov_charset": "[\"â\", \"L\", \"ﻻ\", \"😊\", \"T\", \"ί\", \"ﻹ\", \"
\", \"à\", \"I\", \"U\", \"⤴\", \"V\", \"é\", \"G\", \"A\", \"ۚ\", \"😀\", \"N\", \"ۗ\", \"Y\", \"‏\", \"🙂\", \"X\", \"آ\", \"ّ\", \"ٌ\", \"إ\", \"B\", \"K\", \"ٰ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"F\", \"↩\", \"ۖ\", \"P\", \"أ\", \"R\", \"ö\", \"ٍ\", \"▫\", \"ُ\", \"“\", \"M\", \"J\", \"ِ\", \"Х\", \"H\", \"ٱ\", \"‎\", \"”\", \"W\", \"ή\", \"ﻷ\", \"​\", \"ً\", \"ۤ\", \"Q\", \"ؤ\", \"E\", \"ä\", \"‌\", \"—\", \"‬\", \"–\", \"‘\", \"…\", \"�\", \"’\", \"O\", \"S\", \"\"]", + "lossless": false + }, + "google-bert/bert-base-multilingual-uncased @ cc100/de": { + "tokenizer": "bert-base-multilingual-uncased", + "organization": "Google", + "vocab_size": 105879, + "_n_bytes": 1814876, + "_n_tokens": 425738, + "_n_chars": 1784021, + "_n_oov_chars": 112869, + "oov_ratio": 0.06326663195108129, + "_oov_charset": "[\"â\", \"\", \"ó\", \"T\", \"–\", \"Ã\", \"­\", \" \", \"ί\", \"Á\", \"̈\", \"„\", \"à\", \"I\", \"å\", \"á\", \"U\", \"É\", \"V\", \"ú\", \"≠\", \"ā\", \"ớ\", \"é\", \"G\", \"A\", \"ç\", \"😀\", \"N\", \"Ü\", \"🙁\", \"😂\", \"ï\", \"Y\", \"😃\", \"🙂\", \"❤\", \"X\", \"ư\", \"´\", \"B\", \"K\", \"😉\", \"Ø\", \"C\", \"Z\", \"D\", \"😈\", \"F\", \"↩\", \"ć\", \"P\", \"R\", \"‐\", \"ö\", \"😢\", \"ô\", \"“\", \"`\", \"M\", \"J\", \"û\", \"H\", \"š\", \"‎\", \"İ\", \"”\", \"ė\", \"Ÿ\", \"‽\", \"W\", \"Ä\", \"è\", \"➔\", \"😦\", \"​\", \"☺\", \"ü\", \"č\", \"Q\", \"ä\", \"E\", \"—\", \"“\", \"ń\", \"😆\", \"–\", \"‘\", \"…\", \"’\", \"�\", \"Ö\", \"🙄\", \"O\", \"S\", \"L\"]", + "lossless": false + }, + "google-bert/bert-base-multilingual-uncased @ cc100/fa": { + "tokenizer": "bert-base-multilingual-uncased", + "organization": "Google", + "vocab_size": 105879, + "_n_bytes": 2054052, + "_n_tokens": 398911, + "_n_chars": 1145876, + "_n_oov_chars": 18375, + "oov_ratio": 0.01603576652273021, + "_oov_charset": "[\"G\", \"A\", \"️\", \"​\", \"P\", \"أ\", \"N\", \"R\", \"T\", \"ً\", \"ٍ\", \"­\", \"ُ\", \"Q\", \"“\", \"E\", \"ؤ\", \"ڪ\", \"Y\", \"‌\", \"M\", \"J\", \"‏\", \"❤\", \"X\", \"ِ\", \"✿\", \"ٔ\", \"آ\", \"ّ\", \"H\", \"\", \"ٌ\", \"–\", \"I\", \"ۀ\", \"B\", \"‎\", \"إ\", \"U\", \"K\", \"ּ\", \"◄\", \"َ\", \"‘\", \"ئ\", \"”\", \"…\", \"�\", \"C\", \"’\", \"‍\", \"ْ\", \"W\", \"D\", \"V\", \"Z\", \"O\", \"S\", \"▐\", \"F\", \"L\"]", + "lossless": false + }, + "google-bert/bert-base-multilingual-uncased @ cc100/ja": { + "tokenizer": "bert-base-multilingual-uncased", + "organization": "Google", + "vocab_size": 105879, + "_n_bytes": 1774770, + "_n_tokens": 466785, + "_n_chars": 603065, + "_n_oov_chars": 52508, + "oov_ratio": 0.08706855811562601, + "_oov_charset": "[\"O\", \"Ⅹ\", \"ウ\", \"😊\", \"ハ\", \"T\", \"ば\", \"M\", \"Z\", \"ぎ\", \"🌙\", \"バ\", \"テ\", \"๑\", \"̈\", \"C\", \"ギ\", \"L\", \"T\", \"ヴ\", \"ゎ\", \"😌\", \"ど\", \"ず\", \"I\", \"S\", \"ド\", \"プ\", \"U\", \"H\", \"R\", \"ィ\", \"`\", \"ざ\", \"V\", \"^\", \"纒\", \"ボ\", \"ヽ\", \"⑩\", \"ヘ\", \"W\", \"\", \"G\", \"A\", \"ブ\", \"N\", \"\", \"で\", \"ヾ\", \"̀\", \"丿\", \"Y\", \"Y\", \"E\", \"レ\", \"❤\", \"X\", \"リ\", \"A\", \" ̄\", \"P\", \"⑪\", \"´\", \"B\", \"K\", \"ジ\", \"ぞ\", \"ゼ\", \"Ⅶ\", \"C\", \"ペ\", \"Z\", \"D\", \"メ\", \"瘻\", \"ベ\", \"F\", \"ぷ\", \"ゲ\", \"ぼ\", \"✧\", \"P\", \"$\", \"べ\", \" \", \"―\", \"R\", \"だ\", \"‐\", \"パ\", \"ぶ\", \"び\", \"😢\", \"▷\", \"げ\", \"ポ\", \"⻑\", \"“\", \"`\", \"y\", \"M\", \"😭\", \"N\", \"ア\", \"ガ\", \"J\", \"゚\", \"V\", \"ご\", \"J\", \"ピ\", \"H\", \"が\", \"ぐ\", \"ザ\", \"✨\", \"ゾ\", \"カ\", \"ぴ\", \"I\", \"グ\", \"ヨ\", \"”\", \"U\", \"デ\", \"W\", \"Ⅱ\", \"💦\", \"゙\", \"ズ\", \"́\", \"Д\", \"\\u001b\", \"​\", \"ダ\", \"K\", \"Q\", \"E\", \"ぱ\", \"—\", \"ノ\", \"゙\", \"ゥ\", \"ぽ\", \"ロ\", \"ビ\", \"ゴ\", \"︎\", \"じ\", \"Q\", \"フ\", \"D\", \"–\", \"ゞ\", \"ぜ\", \"G\", \"欝\", \"…\", \"’\", \"�\", \"♫\", \"コ\", \"F\", \"゚\", \"X\", \"\\b\", \"O\", \"⌒\", \"B\", \"S\", \"づ\", \"L\"]", + "lossless": false + }, + "google-bert/bert-base-multilingual-uncased @ cc100/ko": { + "tokenizer": "bert-base-multilingual-uncased", + "organization": "Google", + "vocab_size": 105879, + "_n_bytes": 1524839, + "_n_tokens": 538172, + "_n_chars": 655190, + "_n_oov_chars": 440964, + "oov_ratio": 0.6730322501869687, + "_oov_charset": "[\"교\", \"백\", \"낚\", \"뵙\", \"와\", \"金\", \"프\", \"융\", \"���\", \"펀\", \"묻\", \"❏\", \"벼\", \"차\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"쏭\", \"딴\", \"U\", \"튠\", \"솥\", \"접\", \"냄\", \"힘\", \"A\", \"눌\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"녀\", \"택\", \"슴\", \"퀄\", \"숟\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"ㅓ\", \"✈\", \"뤄\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"녜\", \"헌\", \"識\", \"숨\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"섹\", \"룩\", \"걔\", \"겉\", \"연\", \"몽\", \"L\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"첨\", \"웃\", \"💕\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"풋\", \"딛\", \"㎍\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"핀\", \"맹\", \"😂\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"K\", \"왓\", \"꿕\", \"헨\", \"👍\", \"옵\", \"팡\", \"D\", \"합\", \"싼\", \"올\", \"폐\", \"띤\", \"닙\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"테\", \"ㅎ\", \"춰\", \"볍\", \"콩\", \"리\", \"⑹\", \"탓\", \"춧\", \"콤\", \"박\", \"믹\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"면\", \"⑶\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"촌\", \"팽\", \"석\", \"쿄\", \"쌈\", \"굳\", \"갉\", \"킁\", \"넉\", \"잔\", \"더\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"럽\", \"롬\", \"겔\", \"뛰\", \"틋\", \"즉\", \"캔\", \"샹\", \"‪\", \"🍔\", \"㉠\", \"존\", \"F\", \"생\", \"은\", \"훨\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"웁\", \"끗\", \"쓴\", \"썸\", \"‎\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"쁜\", \"윙\", \"셋\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"😣\", \"갯\", \"율\", \"꺼\", \"T\", \"짱\", \"둡\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"탱\", \"넵\", \"흑\", \"렁\", \"X\", \"롤\", \"꼭\", \"꿨\", \"디\", \"맡\", \"씬\", \"ㅛ\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"됐\", \"앙\", \"퍼\", \"“\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"봄\", \"뜰\", \"긋\", \"중\", \"묵\", \"컷\", \"펩\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"앵\", \"채\", \"찍\", \"럼\", \"뭐\", \"징\", \"마\", \"혔\", \"널\", \"릉\", \"걷\", \"톡\", \"⬇\", \"뭔\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \"므\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"용\", \"륜\", \"쪄\", \"덤\", \"즈\", \"돌\", \"덩\", \"왼\", \"먹\", \"I\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"답\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"폰\", \"놓\", \"많\", \"직\", \"B\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"씨\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"룰\", \"즘\", \"익\", \"씀\", \"⑸\", \"닐\", \"멘\", \"엑\", \"념\", \"쪼\", \"돔\", \"엌\", \"헉\", \"너\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"끼\", \"롱\", \"죠\", \"낙\", \"줏\", \"옌\", \"샴\", \"봅\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"보\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"깃\", \"💌\", \"쿨\", \"뜬\", \"고\", \"췌\", \"빗\", \"무\", \"배\", \"브\", \"밧\", \"길\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"빕\", \"숍\", \"르\", \"갈\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"‬\", \"벅\", \"︎\", \"역\", \"침\", \"반\", \"쿡\", \"철\", \"쥔\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"오\", \"저\", \"닭\", \"홑\", \"방\", \"높\", \"깥\", \"울\", \"슐\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"릅\", \"🦄\", \"삭\", \"☀\", \"탁\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"촉\", \"멜\", \"쐬\", \"잃\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"픕\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"ㅝ\", \"맥\", \"력\", \"㉿\", \"돈\", \"P\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"뜩\", \"렷\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"🦅\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"톨\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"세\", \"뉜\", \"임\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"아\", \"휩\", \"훗\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"째\", \"체\", \"독\", \"작\", \"딪\", \"낫\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"랴\", \"쇼\", \"찢\", \"썰\", \"덮\", \"좇\", \"밭\", \"Z\", \"◼\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"섣\", \"콥\", \"텅\", \"―\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"J\", \"목\", \"뱅\", \"퀵\", \"쏜\", \"얻\", \"몫\", \"”\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"흡\", \"놈\", \"퀴\", \"뼘\", \"민\", \"닿\", \"봐\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"경\", \"묘\", \"냉\", \"추\", \"햄\", \"🗺\", \"을\", \"책\", \"럭\", \"숲\", \"눔\", \"짓\", \"떄\", \"왁\", \"힙\", \"뽀\", \"원\", \"뻔\", \"펠\", \"빠\", \"😱\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"얀\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"격\", \"쿤\", \"ç\", \"곁\", \"워\", \"N\", \"층\", \"퍙\", \"끊\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"꽝\", \"➎\", \"맛\", \"점\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"값\", \"짬\", \"뻐\", \"流\", \"뺑\", \"뮐\", \"H\", \"움\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"쏘\", \"닥\", \"Ⅱ\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"ᴀ\", \"든\", \"풀\", \"랄\", \"딥\", \"빵\", \"씽\", \"—\", \"웹\", \"훅\", \"끄\", \"넷\", \"‘\", \"벚\", \"펑\", \"’\", \"댓\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"쏠\", \"토\", \"픽\", \"좆\", \"🔹\", \"똥\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"한\", \"Y\", \"놔\", \"부\", \"헛\", \"밑\", \"샀\", \"샵\", \"렛\", \"훔\", \"갛\", \"쩌\", \"유\", \"숭\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"편\", \"텝\", \"봉\", \"케\", \"봬\", \"셸\", \"별\", \"햇\", \"굵\", \"끈\", \"훑\", \"싸\", \"벌\", \"W\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"뎀\", \"굽\", \"ã\", \"괜\", \"님\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"톱\", \"ㅐ\", \"춥\", \"털\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"금\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"객\", \"덕\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"–\", \"킵\", \"짤\", \"챌\", \"권\", \"색\", \"찾\", \"션\", \"혀\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"���\", \"천\", \"짧\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"♧\", \"문\", \"🙌\", \"러\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"코\", \"뒀\", \"쒀\", \"상\", \"즌\", \"ㅘ\", \"닳\", \"척\", \"낱\", \"랑\", \"떼\", \"얼\", \"청\", \"씩\", \"앱\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"팎\", \"슷\", \"쩍\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"퉁\", \"대\", \"롸\", \"벤\", \"언\", \"🤭\", \"카\", \"혹\", \"치\", \"핍\", \"칸\", \"잴\", \"꾀\", \"⑨\", \"둬\", \"여\", \"손\", \"V\", \"인\", \"픈\", \"앤\", \"횟\", \"쁠\", \"앓\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"쳐\", \"업\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"섦\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"벽\", \"기\", \"↕\", \"자\", \"쌩\", \"`\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"슛\", \"섯\", \"걸\", \"불\", \"품\", \"찌\", \"Q\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"찼\", \"조\", \"O\", \"쩡\", \"참\", \"섭\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"땠\", \"칵\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"콜\", \"딤\", \"겁\", \"숱\", \"Ⅶ\", \"빛\", \"켤\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"텐\", \"▷\", \"스\", \"턱\", \"있\", \"팔\", \"줘\", \"🌿\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"쇠\", \"🍎\", \"클\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"​\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"가\", \"셀\", \"키\", \"갇\", \"걍\", \"不\", \"⑴\", \"멈\", \"S\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"챨\", \"샘\", \"­\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"최\", \"쨌\", \"몬\", \"찮\", \"龍\", \"슬\", \"쟁\", \"븐\", \"흗\", \"톤\", \"양\", \"G\", \"핫\", \"셔\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"C\", \"눕\", \"젊\", \"뀔\", \"R\", \" \", \"않\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"밉\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"범\", \"절\", \"낀\", \"볕\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"파\", \"밥\", \"멀\", \"폍\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"넓\", \"쉬\", \"먼\", \"붙\", \"쟤\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"희\", \"크\", \"제\", \"패\", \"할\", \"현\", \"전\", \"선\", \"㉣\", \"셉\", \"췄\", \"왘\", \"쑥\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"‍\", \"친\", \"맷\", \"쯔\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"M\", \"칩\", \"켐\", \"빔\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"는\", \"줍\", \"핥\", \"낼\", \"ㅞ\", \"딸\", \"압\", \"죤\", \"덧\", \"모\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"E\", \"획\", \"도\", \"쥐\", \"뻗\", \"외\", \"종\", \"☎\", \"…\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\"]", + "lossless": false + }, + "google-bert/bert-base-uncased @ cc100/ar": { + "tokenizer": "bert-base-uncased", + "organization": "Google", + "vocab_size": 30522, + "_n_bytes": 2813283, + "_n_tokens": 1249370, + "_n_chars": 1560987, + "_n_oov_chars": 71615, + "oov_ratio": 0.04587802460878918, + "_oov_charset": "[\"ﷺ\", \"â\", \"L\", \"ﻻ\", \"😊\", \"٦\", \"T\", \"۲\", \"ί\", \"ﻹ\", \"
\", \"۷\", \"٩\", \"‹\", \"۸\", \"٣\", \"à\", \"I\", \"U\", \"٥\", \"⤴\", \"V\", \"۰\", \"é\", \"G\", \"٪\", \"A\", \"ۚ\", \"😀\", \"N\", \"ۗ\", \"Y\", \"‏\", \"🙂\", \"X\", \"آ\", \"ّ\", \"ٌ\", \"إ\", \"B\", \"K\", \"ٰ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"F\", \"↩\", \"﴾\", \"ۖ\", \"P\", \"أ\", \"R\", \"٢\", \"ö\", \"ٍ\", \"▫\", \"ُ\", \"M\", \"J\", \"ِ\", \"٧\", \"؟\", \"Х\", \"H\", \"ٱ\", \"‎\", \"W\", \"ή\", \"ﻷ\", \"​\", \"٨\", \"٤\", \"١\", \"ً\", \"ۤ\", \"Q\", \"ؤ\", \"E\", \"ä\", \"‌\", \"‬\", \"﴿\", \"�\", \"؛\", \"█\", \"O\", \"S\", \"\"]", + "lossless": false + }, + "google-bert/bert-base-uncased @ cc100/de": { + "tokenizer": "bert-base-uncased", + "organization": "Google", + "vocab_size": 30522, + "_n_bytes": 1814876, + "_n_tokens": 626485, + "_n_chars": 1784021, + "_n_oov_chars": 110979, + "oov_ratio": 0.062207227381292036, + "_oov_charset": "[\"â\", \"\", \"ó\", \"T\", \"–\", \"Ã\", \"▼\", \"­\", \" \", \"ί\", \"Á\", \"̈\", \"„\", \"‹\", \"à\", \"I\", \"å\", \"á\", \"U\", \"É\", \"♡\", \"V\", \"ú\", \"≠\", \"ā\", \"ớ\", \"é\", \"G\", \"A\", \"ç\", \"😀\", \"N\", \"Ü\", \"🙁\", \"😂\", \"ï\", \"Y\", \"😃\", \"🙂\", \"❤\", \"X\", \"ư\", \"B\", \"K\", \"😉\", \"Ø\", \"C\", \"Z\", \"D\", \"😈\", \"F\", \"↩\", \"ć\", \"P\", \"R\", \"ö\", \"😢\", \"ô\", \"M\", \"J\", \"û\", \"H\", \"š\", \"‎\", \"İ\", \"ė\", \"Ÿ\", \"‽\", \"W\", \"Ä\", \"è\", \"➔\", \"😦\", \"​\", \"☺\", \"ü\", \"č\", \"Q\", \"ä\", \"E\", \"“\", \"ń\", \"😆\", \"�\", \"Ö\", \"🙄\", \"O\", \"S\", \"L\"]", + "lossless": false + }, + "google-bert/bert-base-uncased @ cc100/fa": { + "tokenizer": "bert-base-uncased", + "organization": "Google", + "vocab_size": 30522, + "_n_bytes": 2054052, + "_n_tokens": 890783, + "_n_chars": 1145876, + "_n_oov_chars": 23791, + "oov_ratio": 0.020762281433593165, + "_oov_charset": "[\" \", \"T\", \"۲\", \"­\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"۱\", \"۸\", \"٣\", \"I\", \"ۀ\", \"U\", \"◄\", \"٥\", \"V\", \"۰\", \"✿\", \"G\", \"٪\", \"A\", \"N\", \"۔\", \"ڪ\", \"Y\", \"‏\", \"❤\", \"X\", \"آ\", \"ّ\", \"ٌ\", \"ﮧ\", \"۴\", \"B\", \"إ\", \"K\", \"ּ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"٫\", \"‍\", \"F\", \"P\", \"أ\", \"R\", \"٢\", \"ٍ\", \"ۆ\", \"ُ\", \"M\", \"ٴ\", \"J\", \"ِ\", \"٧\", \"؟\", \"H\", \"\", \"‎\", \"۵\", \"W\", \"▐\", \"️\", \"​\", \"٨\", \"٤\", \"١\", \"ً\", \"۶\", \"۳\", \"Q\", \"۹\", \"ؤ\", \"E\", \"‌\", \"�\", \"؛\", \"O\", \"S\", \"L\"]", + "lossless": false + }, + "google-bert/bert-base-uncased @ cc100/ja": { + "tokenizer": "bert-base-uncased", + "organization": "Google", + "vocab_size": 30522, + "_n_bytes": 1774770, + "_n_tokens": 560634, + "_n_chars": 603065, + "_n_oov_chars": 169388, + "oov_ratio": 0.2808785122665053, + "_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"暴\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"循\", \"喚\", \"惨\", \"U\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"草\", \"憶\", \"截\", \"侶\", \"A\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"護\", \"点\", \"眠\", \"鎌\", \"狭\", \"腫\", \"ゼ\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"曹\", \"開\", \"恰\", \"ぷ\", \"段\", \"捉\", \"送\", \"浩\", \"邸\", \"琢\", \"隆\", \"疾\", \"串\", \"笛\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"滲\", \"虐\", \"騰\", \"捐\", \"塵\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"珍\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"陸\", \"亜\", \"f\", \"L\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"倭\", \"表\", \"圃\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"可\", \"杉\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"冷\", \"強\", \"壇\", \"祠\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"泣\", \"候\", \"米\", \"勤\", \"K\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"D\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \"必\", \"蛍\", \"材\", \"跨\", \"胞\", \"潜\", \"猟\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"汁\", \"塔\", \"鍋\", \"妻\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"楓\", \"妊\", \"徳\", \"悔\", \"抱\", \"剃\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"亀\", \"促\", \"膚\", \"Z\", \"嘘\", \"脳\", \"卑\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"嗅\", \"役\", \"0\", \"稚\", \"臨\", \"奮\", \"羊\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"収\", \"略\", \"爪\", \"斬\", \"媒\", \"猿\", \"変\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"競\", \"々\", \"群\", \"救\", \"覗\", \"羅\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"飢\", \"腺\", \"F\", \"漑\", \"署\", \"塾\", \"募\", \"」\", \"掬\", \"律\", \"床\", \"狩\", \"ア\", \"号\", \"奔\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"́\", \"綬\", \"端\", \"秤\", \"魂\", \"建\", \"輿\", \"駆\", \"[\", \"遂\", \"鮮\", \"粋\", \"想\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"延\", \"飼\", \"模\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"特\", \"貰\", \"払\", \"放\", \"T\", \"叉\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"レ\", \"懸\", \"X\", \"睡\", \"喩\", \"嵐\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"往\", \"票\", \"団\", \"涅\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"崩\", \"覆\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"舟\", \"パ\", \"告\", \"詰\", \"画\", \"爾\", \"紫\", \"豚\", \"釣\", \"謬\", \"孫\", \"悪\", \"試\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"精\", \"洋\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"糸\", \"輝\", \"校\", \"等\", \"達\", \"勿\", \"欣\", \"迦\", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"赤\", \"努\", \"効\", \"応\", \"I\", \"%\", \"習\", \"プ\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"躇\", \"誇\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"頂\", \"B\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"恣\", \"碓\", \"梶\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \"棟\", \"退\", \"叫\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"礼\", \"賀\", \"揄\", \"膜\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"屋\", \"関\", \"優\", \"ピ\", \"彷\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"親\", \"翔\", \"垣\", \"痢\", \"粒\", \"絡\", \"乱\", \"紛\", \"揉\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"寄\", \"鹿\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"冒\", \"措\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"股\", \"閲\", \"乳\", \"拘\", \"幡\", \"P\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"範\", \"斡\", \"噂\", \"様\", \"景\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"施\", \"惧\", \"痺\", \"巨\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"注\", \"足\", \"繰\", \"凡\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"磋\", \"椒\", \"慈\", \"判\", \"酔\", \"杜\", \"悟\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"裏\", \"羽\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"贅\", \"科\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"ジ\", \"脅\", \"ぁ\", \"Z\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"砂\", \"密\", \"闘\", \"✧\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"J\", \"呂\", \"V\", \"ご\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"薄\", \"U\", \"率\", \"稲\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"映\", \"補\", \"婿\", \"工\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"幼\", \"繋\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"落\", \"※\", \"使\", \"守\", \"漱\", \"泊\", \"編\", \"遊\", \"尊\", \"典\", \"W\", \"ブ\", \"N\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"勢\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"膝\", \"捗\", \"批\", \"滅\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"H\", \"響\", \"己\", \"敏\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"末\", \"稼\", \"\\u001b\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"滓\", \"5\", \"盆\", \"需\", \"没\", \"善\", \"呑\", \"闊\", \"肉\", \"D\", \"墓\", \"押\", \"蝋\", \"揃\", \"壮\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"戒\", \"バ\", \"債\", \"磯\", \"匡\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"配\", \"付\", \"纒\", \"袈\", \"莫\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"Y\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"短\", \"ぼ\", \"択\", \"届\", \"篇\", \"晋\", \"旋\", \"ポ\", \"=\", \"誉\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"デ\", \"W\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"順\", \"匠\", \"栃\", \"耗\", \"ダ\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"ド\", \"眺\", \"企\", \"県\", \"児\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"掲\", \"併\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"懇\", \"午\", \"e\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"h\", \"趨\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"楚\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"体\", \"解\", \"【\", \"勘\", \"雇\", \"訴\", \"吸\", \"身\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"望\", \"ロ\", \"紙\", \"尿\", \"庭\", \"母\", \"線\", \"遇\", \"漠\", \"離\", \"貿\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"昧\", \"倉\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"暖\", \"序\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"帰\", \"g\", \"幽\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"敷\", \"丈\", \"堵\", \"弓\", \"逢\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"幣\", \"徨\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"牛\", \"化\", \"広\", \"掃\", \"自\", \"父\", \"銀\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"設\", \"昨\", \"屈\", \"蹴\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"ズ\", \"幅\", \"臆\", \"轢\", \"異\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"憂\", \"伐\", \"炎\", \"迫\", \"筈\", \"寂\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"改\", \"塞\", \"狐\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"甲\", \"業\", \"謗\", \"拙\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"V\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"功\", \"岬\", \"丹\", \"ぞ\", \"経\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"険\", \"色\", \"姉\", \"傷\", \"細\", \"囲\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"幕\", \"記\", \"航\", \"肌\", \"溢\", \"グ\", \"並\", \"筋\", \"哲\", \"贈\", \"ユ\", \"稜\", \"全\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"旗\", \"歳\", \"苑\", \"聾\", \"観\", \"殊\", \"Q\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"冨\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"O\", \"B\", \"糞\", \"暗\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"墜\", \"簡\", \"彿\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"舗\", \"淫\", \"暁\", \"ボ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"捧\", \"片\", \"釜\", \"ガ\", \"撮\", \"b\", \"極\", \"棚\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"​\", \"綻\", \"芸\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"コ\", \"「\", \"冬\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"S\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"警\", \"凶\", \"能\", \"_\", \"更\", \"姑\", \"怠\", \"擬\", \"媚\", \"非\", \"駅\", \"供\", \"霧\", \"癌\", \"居\", \"座\", \"篤\", \"推\", \"駐\", \"穫\", \"宜\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"曰\", \"G\", \"讐\", \"鱈\", \"寛\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"底\", \"墳\", \"鈍\", \"沖\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"尺\", \"職\", \"烹\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"蔑\", \"C\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"遍\", \"$\", \"髪\", \" \", \"R\", \"縄\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"沈\", \"任\", \"壌\", \"馳\", \"ヵ\", \"督\", \"燥\", \"餓\", \"簿\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"理\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"晴\", \"頬\", \"汚\", \"揶\", \"起\", \"番\", \"洒\", \"欽\", \"累\", \"破\", \"讃\", \"M\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"楼\", \"始\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"雅\", \"評\", \"現\", \"Д\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"E\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]", + "lossless": false + }, + "google-bert/bert-base-uncased @ cc100/ko": { + "tokenizer": "bert-base-uncased", + "organization": "Google", + "vocab_size": 30522, + "_n_bytes": 1524839, + "_n_tokens": 884756, + "_n_chars": 655190, + "_n_oov_chars": 439583, + "oov_ratio": 0.6709244646591065, + "_oov_charset": "[\"교\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"차\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"쏭\", \"딴\", \"U\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"A\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"ㅓ\", \"✈\", \"뤄\", \"友\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"몽\", \"L\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"可\", \"💕\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"K\", \"왓\", \"꿕\", \"歲\", \"헨\", \"👍\", \"옵\", \"팡\", \"詠\", \"D\", \"합\", \"싼\", \"述\", \"올\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"콩\", \"리\", \"⑹\", \"說\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"適\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"辰\", \"굳\", \"갉\", \"쌈\", \"킁\", \"劍\", \"넉\", \"잔\", \"더\", \"▲\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"‪\", \"🍔\", \"㉠\", \"존\", \"F\", \"생\", \"은\", \"훨\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"‎\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"윙\", \"셋\", \"鮮\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"T\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"렁\", \"X\", \"롤\", \"꼭\", \"꿨\", \"디\", \"實\", \"맡\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"덩\", \"왼\", \"먹\", \"I\", \"%\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"B\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"씨\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"⑸\", \"닐\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"‬\", \"벅\", \"︎\", \"역\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"릅\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"P\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"🦅\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"덮\", \"좇\", \"밭\", \"Z\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"J\", \"목\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"흡\", \"놈\", \"퀴\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"樺\", \"펠\", \"빠\", \"😱\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"守\", \"∙\", \"얀\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"격\", \"典\", \"쿤\", \"ç\", \"곁\", \"워\", \"N\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"H\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"Ⅱ\", \"投\", \"奉\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"ᴀ\", \"든\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"웹\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"벚\", \"펑\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"쏠\", \"토\", \"픽\", \"좆\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"한\", \"Y\", \"놔\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"⑧\", \"렛\", \"□\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"W\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"客\", \"師\", \"臀\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"객\", \"덕\", \"邦\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"至\", \"상\", \"즌\", \"魯\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"척\", \"낱\", \"랑\", \"射\", \"떼\", \"얼\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"V\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"자\", \"色\", \"쌩\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"불\", \"품\", \"찌\", \"Q\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"O\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"賣\", \"쇠\", \"🍎\", \"클\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"​\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"S\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"­\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"居\", \"駐\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"G\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"C\", \"눕\", \"젊\", \"뀔\", \"R\", \" \", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"‍\", \"친\", \"맷\", \"쯔\", \"濁\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"M\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"E\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]", + "lossless": false + }, + "google-t5/t5-large @ cc100/ar": { + "tokenizer": "t5", + "organization": "Google", + "vocab_size": 32100, + "_n_bytes": 2813283, + "_n_tokens": 558855, + "_n_chars": 1560987, + "_n_oov_chars": 1249848, + "oov_ratio": 0.8006780325524813, + "_oov_charset": "[\"α\", \"ﷺ\", \"ﻻ\", \"😊\", \"٦\", \"۲\", \"ع\", \"ί\", \"ذ\", \"ﻹ\", \"~\", \"
\", \"۷\", \"▪\", \"٩\", \"‹\", \"ي\", \"۸\", \"د\", \"٣\", \"ى\", \"ة\", \"ن\", \"ب\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"غ\", \"¡\", \"۰\", \"ط\", \"ء\", \"}\", \"،\", \"٪\", \"ۚ\", \"😀\", \"چ\", \"ك\", \"♥\", \"κ\", \"ۗ\", \"½\", \"ٹ\", \"ظ\", \"‏\", \"🙂\", \"ک\", \"χ\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"×\", \"←\", \"إ\", \"ٰ\", \"َ\", \"ئ\", \"ْ\", \"›\", \"٠\", \"τ\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"μ\", \"أ\", \"٢\", \"ھ\", \"ش\", \"ٍ\", \"▫\", \"ُ\", \"ِ\", \"٧\", \"؟\", \"Х\", \"ٱ\", \"‎\", \"η\", \"″\", \"ث\", \"{\", \"ρ\", \"\\\\\", \"©\", \"ή\", \"ﻷ\", \"ل\", \"​\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"ص\", \"ؤ\", \"‌\", \"م\", \"‬\", \"ر\", \"ا\", \"س\", \"ق\", \"﴿\", \"ه\", \"…\", \"�\", \"^\", \"ف\", \"؛\", \"█\", \"<\", \"و\", \"\"]", + "lossless": false + }, + "google-t5/t5-large @ cc100/de": { + "tokenizer": "t5", + "organization": "Google", + "vocab_size": 32100, + "_n_bytes": 1814876, + "_n_tokens": 470254, + "_n_chars": 1784021, + "_n_oov_chars": 2034, + "oov_ratio": 0.001140121108439867, + "_oov_charset": "[\"α\", \"\", \"‚\", \"→\", \"–\", \"Ã\", \"▼\", \" \", \"ί\", \"Á\", \"̈\", \"~\", \"™\", \"¼\", \"„\", \"‹\", \"å\", \"ς\", \"¶\", \"œ\", \"♡\", \"ú\", \"≠\", \"ā\", \"ớ\", \"¤\", \"}\", \"😀\", \"♥\", \"🙁\", \"😂\", \"ε\", \"ï\", \"😃\", \"½\", \"🙂\", \"❤\", \"ư\", \"´\", \"😉\", \"Ø\", \"↑\", \"·\", \"›\", \"😈\", \"τ\", \"↩\", \"ć\", \"‐\", \"😢\", \"¬\", \"`\", \"★\", \"−\", \"š\", \"‎\", \"İ\", \"ø\", \"{\", \"¹\", \"ė\", \"Ÿ\", \"‽\", \"Ä\", \"ρ\", \"\\\\\", \"➔\", \"©\", \"😦\", \"ι\", \"​\", \"☺\", \"č\", \"“\", \"§\", \"ń\", \"😆\", \"♦\", \"¿\", \"�\", \"…\", \"^\", \"Ö\", \"²\", \"🙄\", \"<\"]", + "lossless": false + }, + "google-t5/t5-large @ cc100/fa": { + "tokenizer": "t5", + "organization": "Google", + "vocab_size": 32100, + "_n_bytes": 2054052, + "_n_tokens": 483767, + "_n_chars": 1145876, + "_n_oov_chars": 898637, + "oov_ratio": 0.7842358160917935, + "_oov_charset": "[\" \", \"۲\", \"ع\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"ي\", \"۱\", \"د\", \"۸\", \"٣\", \"ى\", \"ة\", \"ۀ\", \"ن\", \"◄\", \"ب\", \"پ\", \"●\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"غ\", \"۰\", \"ء\", \"ط\", \"✿\", \"}\", \"،\", \"٪\", \"چ\", \"ك\", \"۔\", \"♥\", \"ט\", \"ڪ\", \"ے\", \"ظ\", \"‏\", \"❤\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"×\", \"ٌ\", \"ﮧ\", \"۴\", \"إ\", \"ּ\", \"َ\", \"ئ\", \"·\", \"ْ\", \"›\", \"٠\", \"٫\", \"‍\", \"ج\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"★\", \"ٴ\", \"ِ\", \"٧\", \"؟\", \"‎\", \"ث\", \"{\", \"۵\", \"▐\", \"\\\\\", \"©\", \"ل\", \"️\", \"​\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"۹\", \"ؤ\", \"‌\", \"م\", \"ر\", \"ا\", \"س\", \"ق\", \"ه\", \"<\", \"…\", \"�\", \"ف\", \"؛\", \"ھ\", \"گ\", \"و\", \"\"]", + "lossless": false + }, + "google-t5/t5-large @ cc100/ja": { + "tokenizer": "t5", + "organization": "Google", + "vocab_size": 32100, + "_n_bytes": 1774770, + "_n_tokens": 41947, + "_n_chars": 603065, + "_n_oov_chars": 585967, + "oov_ratio": 0.9716481639624253, + "_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"帝\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"合\", \"暴\", \"之\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"林\", \"循\", \"喚\", \"惨\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"夫\", \"草\", \"憶\", \"截\", \"侶\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"事\", \"護\", \"点\", \"法\", \"眠\", \"狭\", \"鎌\", \"ツ\", \"腫\", \"ゼ\", \"歌\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"シ\", \"曹\", \"開\", \"恰\", \"ぷ\", \"心\", \"段\", \"捉\", \"れ\", \"送\", \"浩\", \"邸\", \"琢\", \"力\", \"隆\", \"朝\", \"伊\", \"た\", \"疾\", \"串\", \"笛\", \"星\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"北\", \"虐\", \"騰\", \"捐\", \"塵\", \"滲\", \"和\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"©\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"貴\", \"珍\", \"〜\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"清\", \"家\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"<\", \"陸\", \"亜\", \"f\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"尚\", \"倭\", \"表\", \"圃\", \"→\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"〉\", \"可\", \"章\", \"杉\", \"氷\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"道\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"に\", \"冷\", \"強\", \"壇\", \"祠\", \"五\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"史\", \"ゆ\", \"泣\", \"候\", \"米\", \"勤\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"手\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \",\", \"必\", \"蛍\", \"材\", \"跨\", \"場\", \"胞\", \"潜\", \"猟\", \"★\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"陽\", \"汁\", \"塔\", \"鍋\", \"妻\", \"″\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"立\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"同\", \"楓\", \"妊\", \"徳\", \"ろ\", \"悔\", \"抱\", \"剃\", \"版\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"年\", \"見\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"我\", \"促\", \"膚\", \"亀\", \"嘘\", \"脳\", \"卑\", \"正\", \"Z\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"信\", \"役\", \"0\", \"稚\", \"嗅\", \"臨\", \"奮\", \"羊\", \"木\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"介\", \"収\", \"略\", \"斬\", \"村\", \"爪\", \"媒\", \"猿\", \"変\", \"公\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"李\", \"城\", \"競\", \"々\", \"群\", \"ナ\", \"救\", \"覗\", \"羅\", \"東\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"語\", \"飢\", \"腺\", \"漑\", \"て\", \"署\", \"塾\", \"募\", \"タ\", \"」\", \"チ\", \"掬\", \"律\", \"床\", \"狩\", \"子\", \"号\", \"愛\", \"奔\", \"ア\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"́\", \"綬\", \"端\", \"三\", \"秤\", \"魂\", \"建\", \"輿\", \"ウ\", \"駆\", \"[\", \"ぬ\", \"遂\", \"鮮\", \"粋\", \"想\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"ら\", \"延\", \"飼\", \"模\", \"お\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"レ\", \"特\", \"貰\", \"払\", \"放\", \"叉\", \"博\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"⇒\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"を\", \"成\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"真\", \"坂\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"食\", \"レ\", \"懸\", \"久\", \"睡\", \"喩\", \"嵐\", \"井\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"口\", \"空\", \"往\", \"票\", \"・\", \"団\", \"涅\", \"止\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"マ\", \"覆\", \"崩\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"安\", \"舟\", \"パ\", \"告\", \"詰\", \"画\", \"爾\", \"昭\", \"豚\", \"釣\", \"紫\", \"謬\", \"悪\", \"橋\", \"試\", \"孫\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"テ\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"風\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"洋\", \"精\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"-\", \"糸\", \"の\", \"面\", \"輝\", \"校\", \"等\", \"達\", \"光\", \"勿\", \"欣\", \"迦\", \"み\", \"社\", \" \", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"宿\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"英\", \"赤\", \"努\", \"ま\", \"文\", \"効\", \"応\", \"%\", \"習\", \"こ\", \"プ\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"福\", \"躇\", \"鈴\", \"誇\", \"ひ\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"な\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"保\", \"頂\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"青\", \"恣\", \"碓\", \"梶\", \"水\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \":\", \"棟\", \"退\", \"叫\", \"ね\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"戦\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"主\", \"礼\", \"賀\", \"揄\", \"膜\", \"ニ\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"岡\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"セ\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"え\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"世\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"民\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"国\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"���\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"西\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"や\", \"‐\", \"都\", \"阿\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"∇\", \"屋\", \"関\", \"フ\", \"ピ\", \"彷\", \"優\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"〈\", \"》\", \"親\", \"翔\", \"垣\", \"永\", \"痢\", \"方\", \"張\", \"粒\", \"香\", \"絡\", \"乱\", \"紛\", \"揉\", \")\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"曲\", \"は\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"~\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"鹿\", \"寄\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"松\", \"冒\", \"措\", \"雄\", \"國\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"、\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"有\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"四\", \"ノ\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"田\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"股\", \"閲\", \"乳\", \"勝\", \"拘\", \"幡\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"出\", \"範\", \"斡\", \"太\", \"街\", \"不\", \"様\", \"噂\", \"健\", \"景\", \"宮\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"行\", \"施\", \"惧\", \"痺\", \"キ\", \"巨\", \".\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"凡\", \"注\", \"足\", \"繰\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"古\", \"磋\", \"椒\", \"慈\", \"州\", \"判\", \"酔\", \"杜\", \"悟\", \"^\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"ー\", \"羽\", \"裏\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"定\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"門\", \"科\", \"贅\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"吉\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"名\", \"■\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"´\", \"ェ\", \"ジ\", \"脅\", \"ぁ\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"谷\", \"砂\", \"密\", \"闘\", \"✧\", \"―\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"幸\", \"神\", \"呂\", \"ほ\", \"V\", \"ご\", \"山\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"発\", \"薄\", \"U\", \"率\", \"稲\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"軍\", \"映\", \"補\", \"京\", \"婿\", \"工\", \"へ\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"里\", \"幼\", \"繋\", \"内\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"女\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"け\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"比\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"カ\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"金\", \"落\", \"※\", \"使\", \"書\", \"守\", \"漱\", \"●\", \"泊\", \"編\", \"龍\", \"遊\", \"尊\", \"典\", \"W\", \"治\", \"ブ\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"勢\", \"石\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"火\", \"←\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"忠\", \"膝\", \"捗\", \"批\", \"滅\", \"沢\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"相\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"氏\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"地\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"響\", \"己\", \"敏\", \"貝\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"美\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"稼\", \"末\", \"耳\", \"\\\\\", \"\\u001b\", \"漢\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"滓\", \"5\", \"盆\", \"い\", \"目\", \"没\", \"呑\", \"仮\", \"需\", \"善\", \"闊\", \"肉\", \"D\", \"省\", \"秀\", \"押\", \"墓\", \"蝋\", \"揃\", \"ケ\", \"壮\", \"ω\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"武\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"本\", \"戒\", \"バ\", \"債\", \"磯\", \"』\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"匡\", \"ワ\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"陳\", \"配\", \"付\", \"纒\", \"袈\", \"十\", \"莫\", \"『\", \"日\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"す\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"高\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"ち\", \"短\", \"ぼ\", \"択\", \"届\", \"μ\", \"篇\", \"藤\", \"大\", \"晋\", \"旋\", \"ポ\", \"土\", \"代\", \"士\", \"=\", \"誉\", \"め\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"デ\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"楊\", \"順\", \"匠\", \"月\", \"栃\", \"耗\", \"ダ\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"ュ\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"ン\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"劉\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"天\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"ド\", \"眺\", \"企\", \"県\", \"児\", \"奈\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"掲\", \"併\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"宗\", \"懇\", \"午\", \"e\", \"×\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"野\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"オ\", \"趨\", \"h\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"「\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"二\", \"区\", \"楚\", \"ア\", \"ト\", \"る\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"¥\", \"体\", \"解\", \"【\", \"勘\", \"良\", \"雇\", \"訴\", \"吸\", \"身\", \"犬\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"ィ\", \"花\", \"望\", \"紙\", \"尿\", \"庭\", \"ロ\", \"母\", \"線\", \"遇\", \"漠\", \"離\", \"貿\", \"河\", \"示\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"馬\", \"倉\", \"昧\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"☆\", \"暖\", \"序\", \"宇\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"中\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"原\", \"帰\", \"g\", \"幽\", \"車\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"も\", \"敷\", \"丈\", \"堵\", \"ホ\", \"弓\", \"逢\", \"ム\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"也\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"↑\", \"幣\", \"徨\", \"下\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"秋\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"人\", \"《\", \"郎\", \"牛\", \"広\", \"化\", \"掃\", \"う\", \"自\", \"父\", \"銀\", \"王\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"部\", \"−\", \"設\", \"─\", \"昨\", \"ん\", \"屈\", \"蹴\", \"海\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"ズ\", \"幅\", \"臆\", \"轢\", \"異\", \"八\", \"ハ\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"戸\", \"憂\", \"佐\", \"炎\", \"伐\", \"迫\", \"筈\", \"寂\", \"つ\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"後\", \"改\", \"塞\", \"狐\", \"و\", \"窮\", \"晩\", \"振\", \"���\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"イ\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"サ\", \"業\", \"甲\", \"拙\", \"謗\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"モ\", \"長\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"よ\", \"功\", \"岬\", \"上\", \"丹\", \"ぞ\", \"経\", \"御\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"。\", \"崎\", \"険\", \"色\", \"姉\", \"傷\", \"白\", \"細\", \"囲\", \"`\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"新\", \"記\", \"幕\", \"航\", \"あ\", \"肌\", \"溢\", \"グ\", \"並\", \"筋\", \"哲\", \"ヒ\", \"贈\", \"ユ\", \"稜\", \"全\", \"そ\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"皇\", \"ル\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"春\", \"歳\", \"く\", \"旗\", \"り\", \"苑\", \"聾\", \"観\", \"殊\", \"(\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"ふ\", \"ヘ\", \"冨\", \"~\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"前\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"B\", \"寺\", \"糞\", \"暗\", \"的\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"β\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"ッ\", \"墜\", \"簡\", \"っ\", \"彿\", \"加\", \"分\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"コ\", \"郡\", \"舗\", \"淫\", \"暁\", \"ボ\", \"ミ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"一\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"メ\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"せ\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"?\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"堂\", \"捧\", \"片\", \"釜\", \"ガ\", \"撮\", \"b\", \"間\", \"極\", \"棚\", \"華\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"宣\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"仁\", \"​\", \"/\", \"綻\", \"芸\", \"ス\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"し\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"↓\", \"「\", \"冬\", \"コ\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"凶\", \"警\", \"能\", \"_\", \"更\", \"姑\", \"森\", \"怠\", \"川\", \"擬\", \"媚\", \"義\", \"非\", \"駅\", \"供\", \"霧\", \"南\", \"癌\", \"ャ\", \"座\", \"居\", \"篤\", \"推\", \"駐\", \"志\", \"宜\", \"穫\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"き\", \"曰\", \"讐\", \"ク\", \"鱈\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"寛\", \"底\", \"墳\", \"鈍\", \"沖\", \"さ\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"島\", \"ε\", \"尺\", \"職\", \"烹\", \"会\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"ラ\", \"蔑\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"平\", \"遍\", \"男\", \"$\", \"髪\", \" \", \"政\", \"縄\", \"か\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"元\", \"沈\", \"任\", \"壌\", \"馳\", \"ョ\", \"ヵ\", \"督\", \"燥\", \"侍\", \"餓\", \"リ\", \"簿\", \"葉\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"江\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"生\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"ロ\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"」\", \"理\", \"!\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"外\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"司\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"む\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"夏\", \"智\", \"晴\", \"頬\", \"汚\", \"学\", \"揶\", \"起\", \"番\", \"洒\", \"竹\", \"欽\", \"明\", \"累\", \"破\", \"ァ\", \"讃\", \"瀬\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"千\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"樹\", \"楼\", \"始\", \"エ\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"と\", \"雅\", \"評\", \"現\", \"Д\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"小\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"…\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]", + "lossless": false + }, + "google-t5/t5-large @ cc100/ko": { + "tokenizer": "t5", + "organization": "Google", + "vocab_size": 32100, + "_n_bytes": 1524839, + "_n_tokens": 334457, + "_n_chars": 655190, + "_n_oov_chars": 433242, + "oov_ratio": 0.6612463560188647, + "_oov_charset": "[\"교\", \"帝\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"合\", \"차\", \"之\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"林\", \"쏭\", \"딴\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"事\", \"法\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"心\", \"켜\", \"◐\", \"朝\", \"ㅓ\", \"✈\", \"星\", \"友\", \"뤄\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"北\", \"和\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"©\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"家\", \"<\", \"몽\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"→\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"章\", \"〉\", \"可\", \"💕\", \"氷\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"道\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"♥\", \"五\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"史\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"왓\", \"꿕\", \"歲\", \"헨\", \"·\", \"👍\", \"옵\", \"팡\", \"詠\", \"합\", \"싼\", \"述\", \"올\", \"手\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"★\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"陽\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"¹\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"立\", \"콩\", \"리\", \"⑹\", \"說\", \"同\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"將\", \"날\", \"입\", \"못\", \"났\", \"年\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"正\", \"🙋\", \"튿\", \"끔\", \"適\", \"信\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"公\", \"굳\", \"辰\", \"갉\", \"쌈\", \"劍\", \"킁\", \"넉\", \"잔\", \"더\", \"▲\", \"城\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"東\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"‪\", \"🍔\", \"語\", \"㉠\", \"존\", \"생\", \"은\", \"훨\", \"て\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"子\", \"愛\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"‎\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"三\", \"윙\", \"셋\", \"鮮\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"²\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"⇒\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"食\", \"렁\", \"롤\", \"꼭\", \"꿨\", \"디\", \"口\", \"實\", \"맡\", \"・\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"安\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"昭\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"面\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"光\", \"삶\", \"농\", \"쏟\", \"빼\", \"므\", \" \", \"社\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"英\", \"덩\", \"왼\", \"文\", \"먹\", \"%\", \"♣\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"福\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"›\", \"水\", \"씨\", \"없\", \"컵\", \":\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"主\", \"닐\", \"⑸\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"世\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"民\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"〈\", \"》\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"永\", \"샐\", \"같\", \"方\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"‬\", \"벅\", \"︎\", \"역\", \"は\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"~\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"國\", \"릅\", \"雄\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"有\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"出\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"不\", \"🦅\", \"宮\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"行\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"古\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"^\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"門\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"■\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"德\", \"덮\", \"좇\", \"밭\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"谷\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"―\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"목\", \"神\", \"山\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"軍\", \"흡\", \"놈\", \"퀴\", \"京\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"里\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"女\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"⋅\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"比\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"↔\", \"樺\", \"펠\", \"빠\", \"😱\", \"金\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"書\", \"守\", \"∙\", \"얀\", \"●\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"龍\", \"격\", \"}\", \"典\", \"쿤\", \"治\", \"곁\", \"워\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"火\", \"←\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"相\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"地\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"美\", \"Ⅱ\", \"投\", \"奉\", \"\\\\\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"漢\", \"든\", \"ᴀ\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"웹\", \"い\", \"目\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"ω\", \"벚\", \"펑\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"武\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"』\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"陳\", \"쏠\", \"토\", \"픽\", \"좆\", \"十\", \"『\", \"日\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"±\", \"한\", \"놔\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"す\", \"⑧\", \"렛\", \"□\", \"高\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"μ\", \"맞\", \"大\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"土\", \"代\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"{\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"月\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"客\", \"師\", \"臀\", \"α\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"天\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"宗\", \"객\", \"덕\", \"邦\", \"×\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"野\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"「\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"犬\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"☆\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"中\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"原\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"⁴\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"ɪ\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"↑\", \"간\", \"下\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"秋\", \"至\", \"상\", \"즌\", \"魯\", \"人\", \"《\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"王\", \"척\", \"낱\", \"랑\", \"射\", \"部\", \"떼\", \"얼\", \"海\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"八\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"§\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"後\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"長\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"上\", \"국\", \"쌀\", \"샬\", \"≤\", \"뚜\", \"御\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"。\", \"자\", \"色\", \"白\", \"쌩\", \"`\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"新\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"そ\", \"쫒\", \"밌\", \"건\", \"콕\", \"皇\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"春\", \"불\", \"품\", \"찌\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"的\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"分\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"一\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"?\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"堂\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"間\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"뇌\", \"득\", \"투\", \"㈜\", \"賣\", \"쇠\", \"華\", \"클\", \"🍎\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"​\", \"仁\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"し\", \"↓\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"각\", \"갓\", \"川\", \"랭\", \"옥\", \"엮\", \"펴\", \"南\", \"居\", \"駐\", \"志\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"눕\", \"젊\", \"平\", \"男\", \"뀔\", \" \", \"政\", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"江\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"生\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"」\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"外\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"‍\", \"친\", \"맷\", \"쯔\", \"濁\", \"竹\", \"明\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"樹\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"…\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]", + "lossless": false + }, + "google/byt5-small @ cc100/ar": { + "tokenizer": "byt5-small", + "organization": "Google", + "vocab_size": 384, + "_n_bytes": 2813283, + "_n_tokens": 2813283, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "google/byt5-small @ cc100/de": { + "tokenizer": "byt5-small", + "organization": "Google", + "vocab_size": 384, + "_n_bytes": 1814876, + "_n_tokens": 1814876, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "google/byt5-small @ cc100/fa": { + "tokenizer": "byt5-small", + "organization": "Google", + "vocab_size": 384, + "_n_bytes": 2054052, + "_n_tokens": 2054052, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "google/byt5-small @ cc100/ja": { + "tokenizer": "byt5-small", + "organization": "Google", + "vocab_size": 384, + "_n_bytes": 1774770, + "_n_tokens": 1774770, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "google/byt5-small @ cc100/ko": { + "tokenizer": "byt5-small", + "organization": "Google", + "vocab_size": 384, + "_n_bytes": 1524839, + "_n_tokens": 1524839, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "google/gemma-7b @ cc100/ar": { + "tokenizer": "gemma-7b", + "organization": "Google", + "vocab_size": 256000, + "_n_bytes": 2813283, + "_n_tokens": 563788, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "google/gemma-7b @ cc100/de": { + "tokenizer": "gemma-7b", + "organization": "Google", + "vocab_size": 256000, + "_n_bytes": 1814876, + "_n_tokens": 406876, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "google/gemma-7b @ cc100/fa": { + "tokenizer": "gemma-7b", + "organization": "Google", + "vocab_size": 256000, + "_n_bytes": 2054052, + "_n_tokens": 363762, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "google/gemma-7b @ cc100/ja": { + "tokenizer": "gemma-7b", + "organization": "Google", + "vocab_size": 256000, + "_n_bytes": 1774770, + "_n_tokens": 307873, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "google/gemma-7b @ cc100/ko": { + "tokenizer": "gemma-7b", + "organization": "Google", + "vocab_size": 256000, + "_n_bytes": 1524839, + "_n_tokens": 454410, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "google/mobilebert-uncased @ cc100/ar": { + "tokenizer": "mobilebert-uncased", + "organization": "Google", + "vocab_size": 30522, + "_n_bytes": 2813283, + "_n_tokens": 1249370, + "_n_chars": 1560987, + "_n_oov_chars": 71615, + "oov_ratio": 0.04587802460878918, + "_oov_charset": "[\"ﷺ\", \"â\", \"L\", \"ﻻ\", \"😊\", \"٦\", \"T\", \"۲\", \"ί\", \"ﻹ\", \"
\", \"۷\", \"٩\", \"‹\", \"۸\", \"٣\", \"à\", \"I\", \"U\", \"٥\", \"⤴\", \"V\", \"۰\", \"é\", \"G\", \"٪\", \"A\", \"ۚ\", \"😀\", \"N\", \"ۗ\", \"Y\", \"‏\", \"🙂\", \"X\", \"آ\", \"ّ\", \"ٌ\", \"إ\", \"B\", \"K\", \"ٰ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"F\", \"↩\", \"﴾\", \"ۖ\", \"P\", \"أ\", \"R\", \"٢\", \"ö\", \"ٍ\", \"▫\", \"ُ\", \"M\", \"J\", \"ِ\", \"٧\", \"؟\", \"Х\", \"H\", \"ٱ\", \"‎\", \"W\", \"ή\", \"ﻷ\", \"​\", \"٨\", \"٤\", \"١\", \"ً\", \"ۤ\", \"Q\", \"ؤ\", \"E\", \"ä\", \"‌\", \"‬\", \"﴿\", \"�\", \"؛\", \"█\", \"O\", \"S\", \"\"]", + "lossless": false + }, + "google/mobilebert-uncased @ cc100/de": { + "tokenizer": "mobilebert-uncased", + "organization": "Google", + "vocab_size": 30522, + "_n_bytes": 1814876, + "_n_tokens": 626485, + "_n_chars": 1784021, + "_n_oov_chars": 110979, + "oov_ratio": 0.062207227381292036, + "_oov_charset": "[\"â\", \"\", \"ó\", \"T\", \"–\", \"Ã\", \"▼\", \"­\", \" \", \"ί\", \"Á\", \"̈\", \"„\", \"‹\", \"à\", \"I\", \"å\", \"á\", \"U\", \"É\", \"♡\", \"V\", \"ú\", \"≠\", \"ā\", \"ớ\", \"é\", \"G\", \"A\", \"ç\", \"😀\", \"N\", \"Ü\", \"🙁\", \"😂\", \"ï\", \"Y\", \"😃\", \"🙂\", \"❤\", \"X\", \"ư\", \"B\", \"K\", \"😉\", \"Ø\", \"C\", \"Z\", \"D\", \"😈\", \"F\", \"↩\", \"ć\", \"P\", \"R\", \"ö\", \"😢\", \"ô\", \"M\", \"J\", \"û\", \"H\", \"š\", \"‎\", \"İ\", \"ė\", \"Ÿ\", \"‽\", \"W\", \"Ä\", \"è\", \"➔\", \"😦\", \"​\", \"☺\", \"ü\", \"č\", \"Q\", \"ä\", \"E\", \"“\", \"ń\", \"😆\", \"�\", \"Ö\", \"🙄\", \"O\", \"S\", \"L\"]", + "lossless": false + }, + "google/mobilebert-uncased @ cc100/fa": { + "tokenizer": "mobilebert-uncased", + "organization": "Google", + "vocab_size": 30522, + "_n_bytes": 2054052, + "_n_tokens": 890783, + "_n_chars": 1145876, + "_n_oov_chars": 23791, + "oov_ratio": 0.020762281433593165, + "_oov_charset": "[\" \", \"T\", \"۲\", \"­\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"۱\", \"۸\", \"٣\", \"I\", \"ۀ\", \"U\", \"◄\", \"٥\", \"V\", \"۰\", \"✿\", \"G\", \"٪\", \"A\", \"N\", \"۔\", \"ڪ\", \"Y\", \"‏\", \"❤\", \"X\", \"آ\", \"ّ\", \"ٌ\", \"ﮧ\", \"۴\", \"B\", \"إ\", \"K\", \"ּ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"٫\", \"‍\", \"F\", \"P\", \"أ\", \"R\", \"٢\", \"ٍ\", \"ۆ\", \"ُ\", \"M\", \"ٴ\", \"J\", \"ِ\", \"٧\", \"؟\", \"H\", \"\", \"‎\", \"۵\", \"W\", \"▐\", \"️\", \"​\", \"٨\", \"٤\", \"١\", \"ً\", \"۶\", \"۳\", \"Q\", \"۹\", \"ؤ\", \"E\", \"‌\", \"�\", \"؛\", \"O\", \"S\", \"L\"]", + "lossless": false + }, + "google/mobilebert-uncased @ cc100/ja": { + "tokenizer": "mobilebert-uncased", + "organization": "Google", + "vocab_size": 30522, + "_n_bytes": 1774770, + "_n_tokens": 560634, + "_n_chars": 603065, + "_n_oov_chars": 169388, + "oov_ratio": 0.2808785122665053, + "_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"暴\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"循\", \"喚\", \"惨\", \"U\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"草\", \"憶\", \"截\", \"侶\", \"A\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"護\", \"点\", \"眠\", \"鎌\", \"狭\", \"腫\", \"ゼ\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"曹\", \"開\", \"恰\", \"ぷ\", \"段\", \"捉\", \"送\", \"浩\", \"邸\", \"琢\", \"隆\", \"疾\", \"串\", \"笛\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"滲\", \"虐\", \"騰\", \"捐\", \"塵\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"珍\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"陸\", \"亜\", \"f\", \"L\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"倭\", \"表\", \"圃\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"可\", \"杉\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"冷\", \"強\", \"壇\", \"祠\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"泣\", \"候\", \"米\", \"勤\", \"K\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"D\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \"必\", \"蛍\", \"材\", \"跨\", \"胞\", \"潜\", \"猟\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"汁\", \"塔\", \"鍋\", \"妻\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"楓\", \"妊\", \"徳\", \"悔\", \"抱\", \"剃\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"亀\", \"促\", \"膚\", \"Z\", \"嘘\", \"脳\", \"卑\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"嗅\", \"役\", \"0\", \"稚\", \"臨\", \"奮\", \"羊\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"収\", \"略\", \"爪\", \"斬\", \"媒\", \"猿\", \"変\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"競\", \"々\", \"群\", \"救\", \"覗\", \"羅\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"飢\", \"腺\", \"F\", \"漑\", \"署\", \"塾\", \"募\", \"」\", \"掬\", \"律\", \"床\", \"狩\", \"ア\", \"号\", \"奔\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"́\", \"綬\", \"端\", \"秤\", \"魂\", \"建\", \"輿\", \"駆\", \"[\", \"遂\", \"鮮\", \"粋\", \"想\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"延\", \"飼\", \"模\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"特\", \"貰\", \"払\", \"放\", \"T\", \"叉\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"レ\", \"懸\", \"X\", \"睡\", \"喩\", \"嵐\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"往\", \"票\", \"団\", \"涅\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"崩\", \"覆\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"舟\", \"パ\", \"告\", \"詰\", \"画\", \"爾\", \"紫\", \"豚\", \"釣\", \"謬\", \"孫\", \"悪\", \"試\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"精\", \"洋\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"糸\", \"輝\", \"校\", \"等\", \"達\", \"勿\", \"欣\", \"迦\", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"赤\", \"努\", \"効\", \"応\", \"I\", \"%\", \"習\", \"プ\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"躇\", \"誇\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"頂\", \"B\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"恣\", \"碓\", \"梶\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \"棟\", \"退\", \"叫\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"礼\", \"賀\", \"揄\", \"膜\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"屋\", \"関\", \"優\", \"ピ\", \"彷\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"親\", \"翔\", \"垣\", \"痢\", \"粒\", \"絡\", \"乱\", \"紛\", \"揉\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"寄\", \"鹿\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"冒\", \"措\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"股\", \"閲\", \"乳\", \"拘\", \"幡\", \"P\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"範\", \"斡\", \"噂\", \"様\", \"景\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"施\", \"惧\", \"痺\", \"巨\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"注\", \"足\", \"繰\", \"凡\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"磋\", \"椒\", \"慈\", \"判\", \"酔\", \"杜\", \"悟\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"裏\", \"羽\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"贅\", \"科\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"ジ\", \"脅\", \"ぁ\", \"Z\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"砂\", \"密\", \"闘\", \"✧\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"J\", \"呂\", \"V\", \"ご\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"薄\", \"U\", \"率\", \"稲\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"映\", \"補\", \"婿\", \"工\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"幼\", \"繋\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"落\", \"※\", \"使\", \"守\", \"漱\", \"泊\", \"編\", \"遊\", \"尊\", \"典\", \"W\", \"ブ\", \"N\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"勢\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"膝\", \"捗\", \"批\", \"滅\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"H\", \"響\", \"己\", \"敏\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"末\", \"稼\", \"\\u001b\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"滓\", \"5\", \"盆\", \"需\", \"没\", \"善\", \"呑\", \"闊\", \"肉\", \"D\", \"墓\", \"押\", \"蝋\", \"揃\", \"壮\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"戒\", \"バ\", \"債\", \"磯\", \"匡\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"配\", \"付\", \"纒\", \"袈\", \"莫\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"Y\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"短\", \"ぼ\", \"択\", \"届\", \"篇\", \"晋\", \"旋\", \"ポ\", \"=\", \"誉\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"デ\", \"W\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"順\", \"匠\", \"栃\", \"耗\", \"ダ\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"ド\", \"眺\", \"企\", \"県\", \"児\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"掲\", \"併\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"懇\", \"午\", \"e\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"h\", \"趨\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"楚\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"体\", \"解\", \"【\", \"勘\", \"雇\", \"訴\", \"吸\", \"身\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"望\", \"ロ\", \"紙\", \"尿\", \"庭\", \"母\", \"線\", \"遇\", \"漠\", \"離\", \"貿\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"昧\", \"倉\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"暖\", \"序\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"帰\", \"g\", \"幽\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"敷\", \"丈\", \"堵\", \"弓\", \"逢\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"幣\", \"徨\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"牛\", \"化\", \"広\", \"掃\", \"自\", \"父\", \"銀\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"設\", \"昨\", \"屈\", \"蹴\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"ズ\", \"幅\", \"臆\", \"轢\", \"異\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"憂\", \"伐\", \"炎\", \"迫\", \"筈\", \"寂\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"改\", \"塞\", \"狐\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"甲\", \"業\", \"謗\", \"拙\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"V\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"功\", \"岬\", \"丹\", \"ぞ\", \"経\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"険\", \"色\", \"姉\", \"傷\", \"細\", \"囲\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"幕\", \"記\", \"航\", \"肌\", \"溢\", \"グ\", \"並\", \"筋\", \"哲\", \"贈\", \"ユ\", \"稜\", \"全\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"旗\", \"歳\", \"苑\", \"聾\", \"観\", \"殊\", \"Q\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"冨\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"O\", \"B\", \"糞\", \"暗\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"墜\", \"簡\", \"彿\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"舗\", \"淫\", \"暁\", \"ボ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"捧\", \"片\", \"釜\", \"ガ\", \"撮\", \"b\", \"極\", \"棚\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"​\", \"綻\", \"芸\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"コ\", \"「\", \"冬\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"S\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"警\", \"凶\", \"能\", \"_\", \"更\", \"姑\", \"怠\", \"擬\", \"媚\", \"非\", \"駅\", \"供\", \"霧\", \"癌\", \"居\", \"座\", \"篤\", \"推\", \"駐\", \"穫\", \"宜\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"曰\", \"G\", \"讐\", \"鱈\", \"寛\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"底\", \"墳\", \"鈍\", \"沖\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"尺\", \"職\", \"烹\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"蔑\", \"C\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"遍\", \"$\", \"髪\", \" \", \"R\", \"縄\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"沈\", \"任\", \"壌\", \"馳\", \"ヵ\", \"督\", \"燥\", \"餓\", \"簿\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"理\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"晴\", \"頬\", \"汚\", \"揶\", \"起\", \"番\", \"洒\", \"欽\", \"累\", \"破\", \"讃\", \"M\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"楼\", \"始\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"雅\", \"評\", \"現\", \"Д\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"E\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]", + "lossless": false + }, + "google/mobilebert-uncased @ cc100/ko": { + "tokenizer": "mobilebert-uncased", + "organization": "Google", + "vocab_size": 30522, + "_n_bytes": 1524839, + "_n_tokens": 884756, + "_n_chars": 655190, + "_n_oov_chars": 439583, + "oov_ratio": 0.6709244646591065, + "_oov_charset": "[\"교\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"차\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"쏭\", \"딴\", \"U\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"A\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"ㅓ\", \"✈\", \"뤄\", \"友\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"몽\", \"L\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"可\", \"💕\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"K\", \"왓\", \"꿕\", \"歲\", \"헨\", \"👍\", \"옵\", \"팡\", \"詠\", \"D\", \"합\", \"싼\", \"述\", \"올\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"콩\", \"리\", \"⑹\", \"說\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"適\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"辰\", \"굳\", \"갉\", \"쌈\", \"킁\", \"劍\", \"넉\", \"잔\", \"더\", \"▲\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"‪\", \"🍔\", \"㉠\", \"존\", \"F\", \"생\", \"은\", \"훨\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"‎\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"윙\", \"셋\", \"鮮\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"T\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"렁\", \"X\", \"롤\", \"꼭\", \"꿨\", \"디\", \"實\", \"맡\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"덩\", \"왼\", \"먹\", \"I\", \"%\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"B\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"씨\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"⑸\", \"닐\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"‬\", \"벅\", \"︎\", \"역\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"릅\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"P\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"🦅\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"덮\", \"좇\", \"밭\", \"Z\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"J\", \"목\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"흡\", \"놈\", \"퀴\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"樺\", \"펠\", \"빠\", \"😱\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"守\", \"∙\", \"얀\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"격\", \"典\", \"쿤\", \"ç\", \"곁\", \"워\", \"N\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"H\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"Ⅱ\", \"投\", \"奉\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"ᴀ\", \"든\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"웹\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"벚\", \"펑\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"쏠\", \"토\", \"픽\", \"좆\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"한\", \"Y\", \"놔\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"⑧\", \"렛\", \"□\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"W\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"客\", \"師\", \"臀\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"객\", \"덕\", \"邦\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"至\", \"상\", \"즌\", \"魯\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"척\", \"낱\", \"랑\", \"射\", \"떼\", \"얼\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"V\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"자\", \"色\", \"쌩\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"불\", \"품\", \"찌\", \"Q\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"O\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"賣\", \"쇠\", \"🍎\", \"클\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"​\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"S\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"­\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"居\", \"駐\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"G\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"C\", \"눕\", \"젊\", \"뀔\", \"R\", \" \", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"‍\", \"친\", \"맷\", \"쯔\", \"濁\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"M\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"E\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]", + "lossless": false + }, + "google/mt5-large @ cc100/ar": { + "tokenizer": "mt5-large", + "organization": "Google", + "vocab_size": 250100, + "_n_bytes": 2813283, + "_n_tokens": 621736, + "_n_chars": 1560987, + "_n_oov_chars": 767, + "oov_ratio": 0.0004913557896382225, + "_oov_charset": "[\"ﻷ\", \"ﷺ\", \"…\", \"�\", \"​\", \"ﻹ\", \"ﻻ\", \"½\", \"‎\", \"‌\", \"
\", \"‏\", \"″\", \"\"]", + "lossless": false + }, + "google/mt5-large @ cc100/de": { + "tokenizer": "mt5-large", + "organization": "Google", + "vocab_size": 250100, + "_n_bytes": 1814876, + "_n_tokens": 470418, + "_n_chars": 1784021, + "_n_oov_chars": 497, + "oov_ratio": 0.00027858416464828607, + "_oov_charset": "[\" \", \"…\", \"¹\", \"�\", \"​\", \"²\", \"½\", \"‎\", \"´\", \"™\", \"¼\"]", + "lossless": false + }, + "google/mt5-large @ cc100/fa": { + "tokenizer": "mt5-large", + "organization": "Google", + "vocab_size": 250100, + "_n_bytes": 2054052, + "_n_tokens": 419922, + "_n_chars": 1145876, + "_n_oov_chars": 7690, + "oov_ratio": 0.006711022833186139, + "_oov_charset": "[\" \", \"…\", \"�\", \"​\", \"ﮧ\", \"‌\", \"‎\", \"‏\", \"‍\", \"\"]", + "lossless": false + }, + "google/mt5-large @ cc100/ja": { + "tokenizer": "mt5-large", + "organization": "Google", + "vocab_size": 250100, + "_n_bytes": 1774770, + "_n_tokens": 290542, + "_n_chars": 603065, + "_n_oov_chars": 6762, + "oov_ratio": 0.011212721680084236, + "_oov_charset": "[\"¥\", \" \", \";\", \"+\", \"O\", \"a\", \"Ⅹ\", \"ウ\", \"ハ\", \"M\", \"Z\", \"d\", \"_\", \"テ\", \"]\", \"C\", \"L\", \"T\", \"0\", \"S\", \"%\", \"。\", \"g\", \"H\", \"@\", \"R\", \"ィ\", \"`\", \"i\", \"!\", \"^\", \"&\", \"纒\", \"㎞\", \"ヘ\", \"⑩\", \"\\", \"W\", \"t\", \"②\", \"o\", \"Y\", \"E\", \"レ\", \">\", \"リ\", \"A\", \" ̄\", \"P\", \"⑪\", \"e\", \"⑧\", \"´\", \"①\", \"④\", \"ㅂ\", \"Ⅶ\", \"?\", \"ー\", \"<\", \"メ\", \"m\", \"h\", \":\", \"$\", \" \", \",\", \"」\", \"③\", \"・\", \"4\", \"⻑\", \"y\", \"=\", \"ア\", \"N\", \"b\", \"V\", \"J\", \"‼\", \"7\", \"カ\", \"r\", \"I\", \"″\", \"ヨ\", \"U\", \"℃\", \"k\", \"Ⅱ\", \"8\", \"゙\", \"1\", \"*\", \"|\", \"\\u001b\", \"3\", \"​\", \"/\", \"[\", \"K\", \"w\", \"(\", \".\", \"9\", \"ノ\", \")\", \"‥\", \"5\", \"n\", \"ゥ\", \"ロ\", \"2\", \"フ\", \"Q\", \"D\", \"-\", \"G\", \"6\", \"…\", \"�\", \"コ\", \"「\", \"l\", \"F\", \"゚\", \"X\", \"\\b\", \"、\", \"s\", \"B\", \"f\"]", + "lossless": false + }, + "google/mt5-large @ cc100/ko": { + "tokenizer": "mt5-large", + "organization": "Google", + "vocab_size": 250100, + "_n_bytes": 1524839, + "_n_tokens": 424586, + "_n_chars": 655190, + "_n_oov_chars": 1365, + "oov_ratio": 0.0020833651307254385, + "_oov_charset": "[\"폍\", \"ㅕ\", \"Ⅹ\", \"金\", \"璣\", \"챨\", \"ㅁ\", \"Ⅲ\", \"良\", \"⑦\", \"렜\", \"⑶\", \"ㅐ\", \"ⅰ\", \"ㅈ\", \"킌\", \"ㅜ\", \"%\", \"〮\", \"⑨\", \"@\", \"Ⅳ\", \"龍\", \"흗\", \"⁴\", \"㎞\", \"ㅅ\", \"㎍\", \"②\", \"ㅒ\", \"⑤\", \"ㅇ\", \"ⅳ\", \"㉣\", \"㏊\", \"v\", \"왘\", \"퍙\", \"ㅍ\", \"ㅡ\", \"힜\", \"累\", \"Ⅰ\", \"쓕\", \"ㄹ\", \"㉰\", \"ㅗ\", \"⑧\", \"①\", \"ㅙ\", \"ⓒ\", \"④\", \"꿕\", \"ⓔ\", \"㎡\", \"㎥\", \"Ⅶ\", \"ⅲ\", \"?\", \"ㄴ\", \"ㅛ\", \"㉠\", \"‍\", \"ㅝ\", \":\", \"靈\", \"⑥\", \"㉿\", \"ㅟ\", \"③\", \" \", \"Ⅷ\", \"」\", \"쒀\", \"女\", \"ㅓ\", \"뾱\", \"⑵\", \"理\", \"ㄷ\", \"ㅢ\", \"ㅏ\", \"樂\", \"ㄱ\", \"ㅘ\", \"立\", \"ㅣ\", \"삣\", \"流\", \"‎\", \"⑸\", \"ㅖ\", \"㈜\", \"ㅞ\", \"¹\", \"℃\", \"綃\", \"힉\", \"Ⅱ\", \"ㅋ\", \"ㅠ\", \"*\", \"|\", \"樂\", \"陸\", \"ㅎ\", \"ㅔ\", \"​\", \"ㅑ\", \"츈\", \"識\", \"웖\", \"Ⅴ\", \"ㅊ\", \"⑹\", \"梁\", \"Ⅵ\", \"‥\", \"ⅱ\", \"Ⅸ\", \"ㅚ\", \"\", \"ㅆ\", \"�\", \"…\", \"뭥\", \"쫗\", \"「\", \"ㆍ\", \"不\", \"²\", \"⑴\", \"s\", \"➏\", \"․\", \"\"]", + "lossless": false + }, + "google/switch-c-2048 @ cc100/ar": { + "tokenizer": "switch-c-2048", + "organization": "Google", + "vocab_size": 32100, + "_n_bytes": 2813283, + "_n_tokens": 558855, + "_n_chars": 1560987, + "_n_oov_chars": 1249848, + "oov_ratio": 0.8006780325524813, + "_oov_charset": "[\"α\", \"ﷺ\", \"ﻻ\", \"😊\", \"٦\", \"۲\", \"ع\", \"ί\", \"ذ\", \"ﻹ\", \"~\", \"
\", \"۷\", \"▪\", \"٩\", \"‹\", \"ي\", \"۸\", \"د\", \"٣\", \"ى\", \"ة\", \"ن\", \"ب\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"غ\", \"¡\", \"۰\", \"ط\", \"ء\", \"}\", \"،\", \"٪\", \"ۚ\", \"😀\", \"چ\", \"ك\", \"♥\", \"κ\", \"ۗ\", \"½\", \"ٹ\", \"ظ\", \"‏\", \"🙂\", \"ک\", \"χ\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"×\", \"←\", \"إ\", \"ٰ\", \"َ\", \"ئ\", \"ْ\", \"›\", \"٠\", \"τ\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"μ\", \"أ\", \"٢\", \"ھ\", \"ش\", \"ٍ\", \"▫\", \"ُ\", \"ِ\", \"٧\", \"؟\", \"Х\", \"ٱ\", \"‎\", \"η\", \"″\", \"ث\", \"{\", \"ρ\", \"\\\\\", \"©\", \"ή\", \"ﻷ\", \"ل\", \"​\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"ص\", \"ؤ\", \"‌\", \"م\", \"‬\", \"ر\", \"ا\", \"س\", \"ق\", \"﴿\", \"ه\", \"…\", \"�\", \"^\", \"ف\", \"؛\", \"█\", \"<\", \"و\", \"\"]", + "lossless": false + }, + "google/switch-c-2048 @ cc100/de": { + "tokenizer": "switch-c-2048", + "organization": "Google", + "vocab_size": 32100, + "_n_bytes": 1814876, + "_n_tokens": 470254, + "_n_chars": 1784021, + "_n_oov_chars": 2034, + "oov_ratio": 0.001140121108439867, + "_oov_charset": "[\"α\", \"\", \"‚\", \"→\", \"–\", \"Ã\", \"▼\", \" \", \"ί\", \"Á\", \"̈\", \"~\", \"™\", \"¼\", \"„\", \"‹\", \"å\", \"ς\", \"¶\", \"œ\", \"♡\", \"ú\", \"≠\", \"ā\", \"ớ\", \"¤\", \"}\", \"😀\", \"♥\", \"🙁\", \"😂\", \"ε\", \"ï\", \"😃\", \"½\", \"🙂\", \"❤\", \"ư\", \"´\", \"😉\", \"Ø\", \"↑\", \"·\", \"›\", \"😈\", \"τ\", \"↩\", \"ć\", \"‐\", \"😢\", \"¬\", \"`\", \"★\", \"−\", \"š\", \"‎\", \"İ\", \"ø\", \"{\", \"¹\", \"ė\", \"Ÿ\", \"‽\", \"Ä\", \"ρ\", \"\\\\\", \"➔\", \"©\", \"😦\", \"ι\", \"​\", \"☺\", \"č\", \"“\", \"§\", \"ń\", \"😆\", \"♦\", \"¿\", \"�\", \"…\", \"^\", \"Ö\", \"²\", \"🙄\", \"<\"]", + "lossless": false + }, + "google/switch-c-2048 @ cc100/fa": { + "tokenizer": "switch-c-2048", + "organization": "Google", + "vocab_size": 32100, + "_n_bytes": 2054052, + "_n_tokens": 483767, + "_n_chars": 1145876, + "_n_oov_chars": 898637, + "oov_ratio": 0.7842358160917935, + "_oov_charset": "[\" \", \"۲\", \"ع\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"ي\", \"۱\", \"د\", \"۸\", \"٣\", \"ى\", \"ة\", \"ۀ\", \"ن\", \"◄\", \"ب\", \"پ\", \"●\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"غ\", \"۰\", \"ء\", \"ط\", \"✿\", \"}\", \"،\", \"٪\", \"چ\", \"ك\", \"۔\", \"♥\", \"ט\", \"ڪ\", \"ے\", \"ظ\", \"‏\", \"❤\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"×\", \"ٌ\", \"ﮧ\", \"۴\", \"إ\", \"ּ\", \"َ\", \"ئ\", \"·\", \"ْ\", \"›\", \"٠\", \"٫\", \"‍\", \"ج\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"★\", \"ٴ\", \"ِ\", \"٧\", \"؟\", \"‎\", \"ث\", \"{\", \"۵\", \"▐\", \"\\\\\", \"©\", \"ل\", \"️\", \"​\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"۹\", \"ؤ\", \"‌\", \"م\", \"ر\", \"ا\", \"س\", \"ق\", \"ه\", \"<\", \"…\", \"�\", \"ف\", \"؛\", \"ھ\", \"گ\", \"و\", \"\"]", + "lossless": false + }, + "google/switch-c-2048 @ cc100/ja": { + "tokenizer": "switch-c-2048", + "organization": "Google", + "vocab_size": 32100, + "_n_bytes": 1774770, + "_n_tokens": 41947, + "_n_chars": 603065, + "_n_oov_chars": 585967, + "oov_ratio": 0.9716481639624253, + "_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"帝\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"合\", \"暴\", \"之\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"林\", \"循\", \"喚\", \"惨\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"夫\", \"草\", \"憶\", \"截\", \"侶\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"事\", \"護\", \"点\", \"法\", \"眠\", \"狭\", \"鎌\", \"ツ\", \"腫\", \"ゼ\", \"歌\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"シ\", \"曹\", \"開\", \"恰\", \"ぷ\", \"心\", \"段\", \"捉\", \"れ\", \"送\", \"浩\", \"邸\", \"琢\", \"力\", \"隆\", \"朝\", \"伊\", \"た\", \"疾\", \"串\", \"笛\", \"星\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"北\", \"虐\", \"騰\", \"捐\", \"塵\", \"滲\", \"和\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"©\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"貴\", \"珍\", \"〜\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"清\", \"家\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"<\", \"陸\", \"亜\", \"f\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"尚\", \"倭\", \"表\", \"圃\", \"→\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"〉\", \"可\", \"章\", \"杉\", \"氷\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"道\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"に\", \"冷\", \"強\", \"壇\", \"祠\", \"五\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"史\", \"ゆ\", \"泣\", \"候\", \"米\", \"勤\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"手\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \",\", \"必\", \"蛍\", \"材\", \"跨\", \"場\", \"胞\", \"潜\", \"猟\", \"★\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"陽\", \"汁\", \"塔\", \"鍋\", \"妻\", \"″\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"立\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"同\", \"楓\", \"妊\", \"徳\", \"ろ\", \"悔\", \"抱\", \"剃\", \"版\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"年\", \"見\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"我\", \"促\", \"膚\", \"亀\", \"嘘\", \"脳\", \"卑\", \"正\", \"Z\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"信\", \"役\", \"0\", \"稚\", \"嗅\", \"臨\", \"奮\", \"羊\", \"木\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"介\", \"収\", \"略\", \"斬\", \"村\", \"爪\", \"媒\", \"猿\", \"変\", \"公\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"李\", \"城\", \"競\", \"々\", \"群\", \"ナ\", \"救\", \"覗\", \"羅\", \"東\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"語\", \"飢\", \"腺\", \"漑\", \"て\", \"署\", \"塾\", \"募\", \"タ\", \"」\", \"チ\", \"掬\", \"律\", \"床\", \"狩\", \"子\", \"号\", \"愛\", \"奔\", \"ア\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"́\", \"綬\", \"端\", \"三\", \"秤\", \"魂\", \"建\", \"輿\", \"ウ\", \"駆\", \"[\", \"ぬ\", \"遂\", \"鮮\", \"粋\", \"想\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"ら\", \"延\", \"飼\", \"模\", \"お\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"レ\", \"特\", \"貰\", \"払\", \"放\", \"叉\", \"博\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"⇒\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"を\", \"成\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"真\", \"坂\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"食\", \"レ\", \"懸\", \"久\", \"睡\", \"喩\", \"嵐\", \"井\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"口\", \"空\", \"往\", \"票\", \"・\", \"団\", \"涅\", \"止\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"マ\", \"覆\", \"崩\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"安\", \"舟\", \"パ\", \"告\", \"詰\", \"画\", \"爾\", \"昭\", \"豚\", \"釣\", \"紫\", \"謬\", \"悪\", \"橋\", \"試\", \"孫\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"テ\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"風\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"洋\", \"精\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"-\", \"糸\", \"の\", \"面\", \"輝\", \"校\", \"等\", \"達\", \"光\", \"勿\", \"欣\", \"迦\", \"み\", \"社\", \" \", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"宿\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"英\", \"赤\", \"努\", \"ま\", \"文\", \"効\", \"応\", \"%\", \"習\", \"こ\", \"プ\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"福\", \"躇\", \"鈴\", \"誇\", \"ひ\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"な\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"保\", \"頂\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"青\", \"恣\", \"碓\", \"梶\", \"水\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \":\", \"棟\", \"退\", \"叫\", \"ね\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"戦\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"主\", \"礼\", \"賀\", \"揄\", \"膜\", \"ニ\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"岡\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"セ\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"え\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"世\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"民\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"国\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"西\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"や\", \"‐\", \"都\", \"阿\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"∇\", \"屋\", \"関\", \"フ\", \"ピ\", \"彷\", \"優\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"〈\", \"》\", \"親\", \"翔\", \"垣\", \"永\", \"痢\", \"方\", \"張\", \"粒\", \"香\", \"絡\", \"乱\", \"紛\", \"揉\", \")\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"曲\", \"は\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"~\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"鹿\", \"寄\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"松\", \"冒\", \"措\", \"雄\", \"國\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"、\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"有\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"四\", \"ノ\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"田\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"股\", \"閲\", \"乳\", \"勝\", \"拘\", \"幡\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"出\", \"範\", \"斡\", \"太\", \"街\", \"不\", \"様\", \"噂\", \"健\", \"景\", \"宮\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"行\", \"施\", \"惧\", \"痺\", \"キ\", \"巨\", \".\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"凡\", \"注\", \"足\", \"繰\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"古\", \"磋\", \"椒\", \"慈\", \"州\", \"判\", \"酔\", \"杜\", \"悟\", \"^\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"ー\", \"羽\", \"裏\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"定\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"門\", \"科\", \"贅\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"吉\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"名\", \"■\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"´\", \"ェ\", \"ジ\", \"脅\", \"ぁ\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"谷\", \"砂\", \"密\", \"闘\", \"✧\", \"―\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"幸\", \"神\", \"呂\", \"ほ\", \"V\", \"ご\", \"山\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"発\", \"薄\", \"U\", \"率\", \"稲\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"軍\", \"映\", \"補\", \"京\", \"婿\", \"工\", \"へ\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"里\", \"幼\", \"繋\", \"内\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"女\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"け\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"比\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"カ\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"金\", \"落\", \"※\", \"使\", \"書\", \"守\", \"漱\", \"●\", \"泊\", \"編\", \"龍\", \"遊\", \"尊\", \"典\", \"W\", \"治\", \"ブ\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"勢\", \"石\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"火\", \"←\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"忠\", \"膝\", \"捗\", \"批\", \"滅\", \"沢\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"相\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"氏\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"地\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"響\", \"己\", \"敏\", \"貝\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"美\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"稼\", \"末\", \"耳\", \"\\\\\", \"\\u001b\", \"漢\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"滓\", \"5\", \"盆\", \"い\", \"目\", \"没\", \"呑\", \"仮\", \"需\", \"善\", \"闊\", \"肉\", \"D\", \"省\", \"秀\", \"押\", \"墓\", \"蝋\", \"揃\", \"ケ\", \"壮\", \"ω\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"武\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"本\", \"戒\", \"バ\", \"債\", \"磯\", \"』\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"匡\", \"ワ\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"陳\", \"配\", \"付\", \"纒\", \"袈\", \"十\", \"莫\", \"『\", \"日\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"す\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"高\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"ち\", \"短\", \"ぼ\", \"択\", \"届\", \"μ\", \"篇\", \"藤\", \"大\", \"晋\", \"旋\", \"ポ\", \"土\", \"代\", \"士\", \"=\", \"誉\", \"め\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"デ\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"楊\", \"順\", \"匠\", \"月\", \"栃\", \"耗\", \"ダ\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"ュ\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"ン\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"劉\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"天\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"ド\", \"眺\", \"企\", \"県\", \"児\", \"奈\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"掲\", \"併\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"宗\", \"懇\", \"午\", \"e\", \"×\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"野\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"オ\", \"趨\", \"h\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"「\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"二\", \"区\", \"楚\", \"ア\", \"ト\", \"る\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"¥\", \"体\", \"解\", \"【\", \"勘\", \"良\", \"雇\", \"訴\", \"吸\", \"身\", \"犬\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"ィ\", \"花\", \"望\", \"紙\", \"尿\", \"庭\", \"ロ\", \"母\", \"線\", \"遇\", \"漠\", \"離\", \"貿\", \"河\", \"示\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"馬\", \"倉\", \"昧\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"☆\", \"暖\", \"序\", \"宇\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"中\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"原\", \"帰\", \"g\", \"幽\", \"車\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"も\", \"敷\", \"丈\", \"堵\", \"ホ\", \"弓\", \"逢\", \"ム\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"也\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"↑\", \"幣\", \"徨\", \"下\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"秋\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"人\", \"《\", \"郎\", \"牛\", \"広\", \"化\", \"掃\", \"う\", \"自\", \"父\", \"銀\", \"王\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"部\", \"−\", \"設\", \"─\", \"昨\", \"ん\", \"屈\", \"蹴\", \"海\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"ズ\", \"幅\", \"臆\", \"轢\", \"異\", \"八\", \"ハ\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"戸\", \"憂\", \"佐\", \"炎\", \"伐\", \"迫\", \"筈\", \"寂\", \"つ\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"後\", \"改\", \"塞\", \"狐\", \"و\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"イ\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"サ\", \"業\", \"甲\", \"拙\", \"謗\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"モ\", \"長\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"よ\", \"功\", \"岬\", \"上\", \"丹\", \"ぞ\", \"経\", \"御\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"。\", \"崎\", \"険\", \"色\", \"姉\", \"傷\", \"白\", \"細\", \"囲\", \"`\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"新\", \"記\", \"幕\", \"航\", \"あ\", \"肌\", \"溢\", \"グ\", \"並\", \"筋\", \"哲\", \"ヒ\", \"贈\", \"ユ\", \"稜\", \"全\", \"そ\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"皇\", \"ル\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"春\", \"歳\", \"く\", \"旗\", \"り\", \"苑\", \"聾\", \"観\", \"殊\", \"(\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"ふ\", \"ヘ\", \"冨\", \"~\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"前\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"B\", \"寺\", \"糞\", \"暗\", \"的\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"β\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"ッ\", \"墜\", \"簡\", \"っ\", \"彿\", \"加\", \"分\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"コ\", \"郡\", \"舗\", \"淫\", \"暁\", \"ボ\", \"ミ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"一\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"メ\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"せ\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"?\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"堂\", \"捧\", \"片\", \"釜\", \"ガ\", \"撮\", \"b\", \"間\", \"極\", \"棚\", \"華\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"宣\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"仁\", \"​\", \"/\", \"綻\", \"芸\", \"ス\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"し\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"↓\", \"「\", \"冬\", \"コ\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"凶\", \"警\", \"能\", \"_\", \"更\", \"姑\", \"森\", \"怠\", \"川\", \"擬\", \"媚\", \"義\", \"非\", \"駅\", \"供\", \"霧\", \"南\", \"癌\", \"ャ\", \"座\", \"居\", \"篤\", \"推\", \"駐\", \"志\", \"宜\", \"穫\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"き\", \"曰\", \"讐\", \"ク\", \"鱈\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"寛\", \"底\", \"墳\", \"鈍\", \"沖\", \"さ\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"島\", \"ε\", \"尺\", \"職\", \"烹\", \"会\", \"衆\", \"薙\", \"迎\", \"���\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"ラ\", \"蔑\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"平\", \"遍\", \"男\", \"$\", \"髪\", \" \", \"政\", \"縄\", \"か\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"元\", \"沈\", \"任\", \"壌\", \"馳\", \"ョ\", \"ヵ\", \"督\", \"燥\", \"侍\", \"餓\", \"リ\", \"簿\", \"葉\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"江\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"生\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"ロ\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"」\", \"理\", \"!\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"外\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"司\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"む\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"夏\", \"智\", \"晴\", \"頬\", \"汚\", \"学\", \"揶\", \"起\", \"番\", \"洒\", \"竹\", \"欽\", \"明\", \"累\", \"破\", \"ァ\", \"讃\", \"瀬\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"千\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"樹\", \"楼\", \"始\", \"エ\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"と\", \"雅\", \"評\", \"現\", \"Д\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"小\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"…\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]", + "lossless": false + }, + "google/switch-c-2048 @ cc100/ko": { + "tokenizer": "switch-c-2048", + "organization": "Google", + "vocab_size": 32100, + "_n_bytes": 1524839, + "_n_tokens": 334457, + "_n_chars": 655190, + "_n_oov_chars": 433242, + "oov_ratio": 0.6612463560188647, + "_oov_charset": "[\"교\", \"帝\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"合\", \"차\", \"之\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"林\", \"쏭\", \"딴\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"事\", \"法\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"心\", \"켜\", \"◐\", \"朝\", \"ㅓ\", \"✈\", \"星\", \"友\", \"뤄\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"北\", \"和\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"©\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"家\", \"<\", \"몽\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"→\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"章\", \"〉\", \"可\", \"💕\", \"氷\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"道\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"♥\", \"五\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"史\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"왓\", \"꿕\", \"歲\", \"헨\", \"·\", \"👍\", \"옵\", \"팡\", \"詠\", \"합\", \"싼\", \"述\", \"올\", \"手\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"★\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"陽\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"¹\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"立\", \"콩\", \"리\", \"⑹\", \"說\", \"同\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"將\", \"날\", \"입\", \"못\", \"났\", \"年\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"正\", \"🙋\", \"튿\", \"끔\", \"適\", \"信\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"公\", \"굳\", \"辰\", \"갉\", \"쌈\", \"劍\", \"킁\", \"넉\", \"잔\", \"더\", \"▲\", \"城\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"東\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"‪\", \"🍔\", \"語\", \"㉠\", \"존\", \"생\", \"은\", \"훨\", \"て\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"子\", \"愛\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"‎\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"三\", \"윙\", \"셋\", \"鮮\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"²\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"⇒\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"食\", \"렁\", \"롤\", \"꼭\", \"꿨\", \"디\", \"口\", \"實\", \"맡\", \"・\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"安\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"昭\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"面\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"光\", \"삶\", \"농\", \"쏟\", \"빼\", \"므\", \" \", \"社\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"英\", \"덩\", \"왼\", \"文\", \"먹\", \"%\", \"♣\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"福\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"›\", \"水\", \"씨\", \"없\", \"컵\", \":\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"主\", \"닐\", \"⑸\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"世\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"民\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"〈\", \"》\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"永\", \"샐\", \"같\", \"方\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"‬\", \"벅\", \"︎\", \"역\", \"は\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"~\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"國\", \"릅\", \"雄\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"有\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"出\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"不\", \"🦅\", \"宮\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"行\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"古\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"^\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"門\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"■\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"德\", \"덮\", \"좇\", \"밭\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"谷\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"―\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"목\", \"神\", \"山\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"軍\", \"흡\", \"놈\", \"퀴\", \"京\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"里\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"女\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"⋅\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"比\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"↔\", \"樺\", \"펠\", \"빠\", \"😱\", \"金\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"書\", \"守\", \"∙\", \"얀\", \"●\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"龍\", \"격\", \"}\", \"典\", \"쿤\", \"治\", \"곁\", \"워\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"火\", \"←\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"相\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"地\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"美\", \"Ⅱ\", \"投\", \"奉\", \"\\\\\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"漢\", \"든\", \"ᴀ\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"웹\", \"い\", \"目\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"ω\", \"벚\", \"펑\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"武\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"』\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"陳\", \"쏠\", \"토\", \"픽\", \"좆\", \"十\", \"『\", \"日\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"±\", \"한\", \"놔\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"す\", \"⑧\", \"렛\", \"□\", \"高\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"μ\", \"맞\", \"大\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"土\", \"代\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"{\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"月\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"客\", \"師\", \"臀\", \"α\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"天\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"宗\", \"객\", \"덕\", \"邦\", \"×\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"野\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"「\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"犬\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"☆\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"中\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"原\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"⁴\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"ɪ\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"↑\", \"간\", \"下\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"秋\", \"至\", \"상\", \"즌\", \"魯\", \"人\", \"《\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"王\", \"척\", \"낱\", \"랑\", \"射\", \"部\", \"떼\", \"얼\", \"海\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"八\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"§\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"後\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"長\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"上\", \"국\", \"쌀\", \"샬\", \"≤\", \"뚜\", \"御\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"。\", \"자\", \"色\", \"白\", \"쌩\", \"`\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"新\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"そ\", \"쫒\", \"밌\", \"건\", \"콕\", \"皇\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"春\", \"불\", \"품\", \"찌\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"的\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"分\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"一\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"?\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"堂\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"間\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"뇌\", \"득\", \"투\", \"㈜\", \"賣\", \"쇠\", \"華\", \"클\", \"🍎\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"​\", \"仁\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"し\", \"↓\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"각\", \"갓\", \"川\", \"랭\", \"옥\", \"엮\", \"펴\", \"南\", \"居\", \"駐\", \"志\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"눕\", \"젊\", \"平\", \"男\", \"뀔\", \" \", \"政\", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"江\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"生\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"」\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"外\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"‍\", \"친\", \"맷\", \"쯔\", \"濁\", \"竹\", \"明\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"樹\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"…\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]", + "lossless": false + }, + "gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/ar": { + "tokenizer": "llama3", + "organization": "Meta", + "vocab_size": 128256, + "_n_bytes": 2813283, + "_n_tokens": 615514, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/de": { + "tokenizer": "llama3", + "organization": "Meta", + "vocab_size": 128256, + "_n_bytes": 1814876, + "_n_tokens": 499766, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/fa": { + "tokenizer": "llama3", + "organization": "Meta", + "vocab_size": 128256, + "_n_bytes": 2054052, + "_n_tokens": 387448, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/ja": { + "tokenizer": "llama3", + "organization": "Meta", + "vocab_size": 128256, + "_n_bytes": 1774770, + "_n_tokens": 414715, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/ko": { + "tokenizer": "llama3", + "organization": "Meta", + "vocab_size": 128256, + "_n_bytes": 1524839, + "_n_tokens": 412595, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "hfl/chinese-alpaca-lora-7b @ cc100/ar": { + "tokenizer": "chinese-alpaca-lora-7b", + "organization": "-", + "vocab_size": 49954, + "_n_bytes": 2813283, + "_n_tokens": 1411469, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-alpaca-lora-7b @ cc100/de": { + "tokenizer": "chinese-alpaca-lora-7b", + "organization": "-", + "vocab_size": 49954, + "_n_bytes": 1814876, + "_n_tokens": 513706, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-alpaca-lora-7b @ cc100/fa": { + "tokenizer": "chinese-alpaca-lora-7b", + "organization": "-", + "vocab_size": 49954, + "_n_bytes": 2054052, + "_n_tokens": 1140740, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-alpaca-lora-7b @ cc100/ja": { + "tokenizer": "chinese-alpaca-lora-7b", + "organization": "-", + "vocab_size": 49954, + "_n_bytes": 1774770, + "_n_tokens": 604112, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-alpaca-lora-7b @ cc100/ko": { + "tokenizer": "chinese-alpaca-lora-7b", + "organization": "-", + "vocab_size": 49954, + "_n_bytes": 1524839, + "_n_tokens": 903453, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-llama-2-7b @ cc100/ar": { + "tokenizer": "chinese-llama-2-7b", + "organization": "-", + "vocab_size": 55296, + "_n_bytes": 2813283, + "_n_tokens": 1422081, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-llama-2-7b @ cc100/de": { + "tokenizer": "chinese-llama-2-7b", + "organization": "-", + "vocab_size": 55296, + "_n_bytes": 1814876, + "_n_tokens": 527318, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-llama-2-7b @ cc100/fa": { + "tokenizer": "chinese-llama-2-7b", + "organization": "-", + "vocab_size": 55296, + "_n_bytes": 2054052, + "_n_tokens": 1145078, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-llama-2-7b @ cc100/ja": { + "tokenizer": "chinese-llama-2-7b", + "organization": "-", + "vocab_size": 55296, + "_n_bytes": 1774770, + "_n_tokens": 614367, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-llama-2-7b @ cc100/ko": { + "tokenizer": "chinese-llama-2-7b", + "organization": "-", + "vocab_size": 55296, + "_n_bytes": 1524839, + "_n_tokens": 953427, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-llama-lora-7b @ cc100/ar": { + "tokenizer": "chinese-llama-lora-7b", + "organization": "-", + "vocab_size": 49953, + "_n_bytes": 2813283, + "_n_tokens": 1411469, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-llama-lora-7b @ cc100/de": { + "tokenizer": "chinese-llama-lora-7b", + "organization": "-", + "vocab_size": 49953, + "_n_bytes": 1814876, + "_n_tokens": 513706, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-llama-lora-7b @ cc100/fa": { + "tokenizer": "chinese-llama-lora-7b", + "organization": "-", + "vocab_size": 49953, + "_n_bytes": 2054052, + "_n_tokens": 1140740, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-llama-lora-7b @ cc100/ja": { + "tokenizer": "chinese-llama-lora-7b", + "organization": "-", + "vocab_size": 49953, + "_n_bytes": 1774770, + "_n_tokens": 604112, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/chinese-llama-lora-7b @ cc100/ko": { + "tokenizer": "chinese-llama-lora-7b", + "organization": "-", + "vocab_size": 49953, + "_n_bytes": 1524839, + "_n_tokens": 903453, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hfl/llama-3-chinese-8b @ cc100/ar": { + "tokenizer": "llama-3-chinese-8b", + "organization": "-", + "vocab_size": 128256, + "_n_bytes": 2813283, + "_n_tokens": 614186, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "hfl/llama-3-chinese-8b @ cc100/de": { + "tokenizer": "llama-3-chinese-8b", + "organization": "-", + "vocab_size": 128256, + "_n_bytes": 1814876, + "_n_tokens": 499766, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "hfl/llama-3-chinese-8b @ cc100/fa": { + "tokenizer": "llama-3-chinese-8b", + "organization": "-", + "vocab_size": 128256, + "_n_bytes": 2054052, + "_n_tokens": 384591, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "hfl/llama-3-chinese-8b @ cc100/ja": { + "tokenizer": "llama-3-chinese-8b", + "organization": "-", + "vocab_size": 128256, + "_n_bytes": 1774770, + "_n_tokens": 414715, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "hfl/llama-3-chinese-8b @ cc100/ko": { + "tokenizer": "llama-3-chinese-8b", + "organization": "-", + "vocab_size": 128256, + "_n_bytes": 1524839, + "_n_tokens": 412433, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "hpcai-tech/grok-1 @ cc100/ar": { + "tokenizer": "grok-1", + "organization": "xAI", + "vocab_size": 131072, + "_n_bytes": 2813283, + "_n_tokens": 1392088, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hpcai-tech/grok-1 @ cc100/de": { + "tokenizer": "grok-1", + "organization": "xAI", + "vocab_size": 131072, + "_n_bytes": 1814876, + "_n_tokens": 505220, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hpcai-tech/grok-1 @ cc100/fa": { + "tokenizer": "grok-1", + "organization": "xAI", + "vocab_size": 131072, + "_n_bytes": 2054052, + "_n_tokens": 1073281, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hpcai-tech/grok-1 @ cc100/ja": { + "tokenizer": "grok-1", + "organization": "xAI", + "vocab_size": 131072, + "_n_bytes": 1774770, + "_n_tokens": 497590, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "hpcai-tech/grok-1 @ cc100/ko": { + "tokenizer": "grok-1", + "organization": "xAI", + "vocab_size": 131072, + "_n_bytes": 1524839, + "_n_tokens": 1152005, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "huggyllama/llama-7b @ cc100/ar": { + "tokenizer": "llama", + "organization": "Meta", + "vocab_size": 32000, + "_n_bytes": 2813283, + "_n_tokens": 1422081, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "huggyllama/llama-7b @ cc100/de": { + "tokenizer": "llama", + "organization": "Meta", + "vocab_size": 32000, + "_n_bytes": 1814876, + "_n_tokens": 527320, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "huggyllama/llama-7b @ cc100/fa": { + "tokenizer": "llama", + "organization": "Meta", + "vocab_size": 32000, + "_n_bytes": 2054052, + "_n_tokens": 1145076, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "huggyllama/llama-7b @ cc100/ja": { + "tokenizer": "llama", + "organization": "Meta", + "vocab_size": 32000, + "_n_bytes": 1774770, + "_n_tokens": 718461, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "huggyllama/llama-7b @ cc100/ko": { + "tokenizer": "llama", + "organization": "Meta", + "vocab_size": 32000, + "_n_bytes": 1524839, + "_n_tokens": 954428, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "internlm/internlm-chat-7b @ cc100/ar": { + "tokenizer": "internlm-chat-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 103168, + "_n_bytes": 2813283, + "_n_tokens": 522046, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "internlm/internlm-chat-7b @ cc100/de": { + "tokenizer": "internlm-chat-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 103168, + "_n_bytes": 1814876, + "_n_tokens": 570489, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "internlm/internlm-chat-7b @ cc100/fa": { + "tokenizer": "internlm-chat-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 103168, + "_n_bytes": 2054052, + "_n_tokens": 630945, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "internlm/internlm-chat-7b @ cc100/ja": { + "tokenizer": "internlm-chat-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 103168, + "_n_bytes": 1774770, + "_n_tokens": 438212, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "internlm/internlm-chat-7b @ cc100/ko": { + "tokenizer": "internlm-chat-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 103168, + "_n_bytes": 1524839, + "_n_tokens": 829609, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "internlm/internlm-xcomposer-7b @ cc100/ar": { + "tokenizer": "internlm-xcomposer-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 103168, + "_n_bytes": 2813283, + "_n_tokens": 522046, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "internlm/internlm-xcomposer-7b @ cc100/de": { + "tokenizer": "internlm-xcomposer-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 103168, + "_n_bytes": 1814876, + "_n_tokens": 570489, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "internlm/internlm-xcomposer-7b @ cc100/fa": { + "tokenizer": "internlm-xcomposer-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 103168, + "_n_bytes": 2054052, + "_n_tokens": 630945, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "internlm/internlm-xcomposer-7b @ cc100/ja": { + "tokenizer": "internlm-xcomposer-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 103168, + "_n_bytes": 1774770, + "_n_tokens": 438212, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "internlm/internlm-xcomposer-7b @ cc100/ko": { + "tokenizer": "internlm-xcomposer-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 103168, + "_n_bytes": 1524839, + "_n_tokens": 829609, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "internlm/internlm2-chat-7b @ cc100/ar": { + "tokenizer": "internlm2-chat-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 92544, + "_n_bytes": 2813283, + "_n_tokens": 1625378, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "internlm/internlm2-chat-7b @ cc100/de": { + "tokenizer": "internlm2-chat-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 92544, + "_n_bytes": 1814876, + "_n_tokens": 573917, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "internlm/internlm2-chat-7b @ cc100/fa": { + "tokenizer": "internlm2-chat-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 92544, + "_n_bytes": 2054052, + "_n_tokens": 1185032, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "internlm/internlm2-chat-7b @ cc100/ja": { + "tokenizer": "internlm2-chat-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 92544, + "_n_bytes": 1774770, + "_n_tokens": 585803, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "internlm/internlm2-chat-7b @ cc100/ko": { + "tokenizer": "internlm2-chat-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 92544, + "_n_bytes": 1524839, + "_n_tokens": 998524, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "internlm/internlm2-math-7b @ cc100/ar": { + "tokenizer": "internlm2-math-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 92544, + "_n_bytes": 2813283, + "_n_tokens": 1625378, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "internlm/internlm2-math-7b @ cc100/de": { + "tokenizer": "internlm2-math-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 92544, + "_n_bytes": 1814876, + "_n_tokens": 573917, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "internlm/internlm2-math-7b @ cc100/fa": { + "tokenizer": "internlm2-math-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 92544, + "_n_bytes": 2054052, + "_n_tokens": 1185032, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "internlm/internlm2-math-7b @ cc100/ja": { + "tokenizer": "internlm2-math-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 92544, + "_n_bytes": 1774770, + "_n_tokens": 585803, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "internlm/internlm2-math-7b @ cc100/ko": { + "tokenizer": "internlm2-math-7b", + "organization": "Shanghai AI Lab", + "vocab_size": 92544, + "_n_bytes": 1524839, + "_n_tokens": 998524, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "lmsys/fastchat-t5-3b-v1.0 @ cc100/ar": { + "tokenizer": "fastchat-t5-3b-v1.0", + "organization": "LMSYS", + "vocab_size": 32110, + "_n_bytes": 2813283, + "_n_tokens": 822267, + "_n_chars": 1560987, + "_n_oov_chars": 1248838, + "oov_ratio": 0.8000310060237529, + "_oov_charset": "[\"α\", \"ﷺ\", \"ﻻ\", \"😊\", \"٦\", \"۲\", \"ع\", \"ί\", \"ذ\", \"ﻹ\", \"~\", \"
\", \"۷\", \"▪\", \"٩\", \"‹\", \"ي\", \"۸\", \"د\", \"٣\", \"ى\", \"ة\", \"ن\", \"ب\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"غ\", \"¡\", \"۰\", \"ط\", \"ء\", \"،\", \"٪\", \"ۚ\", \"😀\", \"چ\", \"ك\", \"♥\", \"κ\", \"ۗ\", \"½\", \"ٹ\", \"ظ\", \"‏\", \"🙂\", \"ک\", \"χ\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"×\", \"←\", \"إ\", \"ٰ\", \"َ\", \"ئ\", \"ْ\", \"›\", \"٠\", \"τ\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"μ\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"▫\", \"ُ\", \"ِ\", \"٧\", \"؟\", \"Х\", \"ٱ\", \"‎\", \"η\", \"″\", \"ث\", \"ρ\", \"©\", \"ή\", \"ﻷ\", \"ل\", \"​\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"ص\", \"ؤ\", \"‌\", \"م\", \"‬\", \"ر\", \"ا\", \"س\", \"ق\", \"﴿\", \"ه\", \"…\", \"�\", \"ف\", \"؛\", \"█\", \"ھ\", \"و\", \"\"]", + "lossless": false + }, + "lmsys/fastchat-t5-3b-v1.0 @ cc100/de": { + "tokenizer": "fastchat-t5-3b-v1.0", + "organization": "LMSYS", + "vocab_size": 32110, + "_n_bytes": 1814876, + "_n_tokens": 726989, + "_n_chars": 1784021, + "_n_oov_chars": 1930, + "oov_ratio": 0.0010818258305255375, + "_oov_charset": "[\"α\", \"\", \"‚\", \"→\", \"–\", \"Ã\", \"▼\", \" \", \"ί\", \"Á\", \"̈\", \"~\", \"™\", \"¼\", \"„\", \"‹\", \"å\", \"ς\", \"¶\", \"œ\", \"♡\", \"ú\", \"≠\", \"ā\", \"ớ\", \"¤\", \"😀\", \"♥\", \"🙁\", \"😂\", \"ε\", \"ï\", \"😃\", \"½\", \"🙂\", \"❤\", \"ư\", \"´\", \"😉\", \"Ø\", \"↑\", \"·\", \"›\", \"😈\", \"τ\", \"↩\", \"ć\", \"‐\", \"😢\", \"¬\", \"★\", \"−\", \"š\", \"‎\", \"İ\", \"ø\", \"¹\", \"ė\", \"Ÿ\", \"‽\", \"Ä\", \"ρ\", \"©\", \"➔\", \"😦\", \"ι\", \"​\", \"☺\", \"č\", \"“\", \"§\", \"ń\", \"😆\", \"♦\", \"¿\", \"…\", \"�\", \"Ö\", \"²\", \"🙄\"]", + "lossless": false + }, + "lmsys/fastchat-t5-3b-v1.0 @ cc100/fa": { + "tokenizer": "fastchat-t5-3b-v1.0", + "organization": "LMSYS", + "vocab_size": 32110, + "_n_bytes": 2054052, + "_n_tokens": 702443, + "_n_chars": 1145876, + "_n_oov_chars": 898585, + "oov_ratio": 0.7841904359634027, + "_oov_charset": "[\"۲\", \"ع\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"ي\", \"۱\", \"د\", \"۸\", \"٣\", \"ى\", \"ة\", \"ۀ\", \"ن\", \"◄\", \"ب\", \"پ\", \"●\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"غ\", \"۰\", \"ء\", \"ط\", \"✿\", \"،\", \"٪\", \"چ\", \"ك\", \"۔\", \"♥\", \"ט\", \"ڪ\", \"ے\", \"ظ\", \"‏\", \"❤\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"×\", \"ٌ\", \"ﮧ\", \"۴\", \"إ\", \"ּ\", \"َ\", \"ئ\", \"·\", \"ْ\", \"›\", \"٠\", \"٫\", \"‍\", \"ج\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"★\", \"ٴ\", \"ِ\", \"٧\", \"؟\", \"‎\", \"ث\", \"۵\", \"▐\", \"©\", \"ل\", \"️\", \"​\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"۹\", \"ؤ\", \"‌\", \"م\", \"ر\", \"ا\", \"س\", \"ق\", \"ه\", \"…\", \"�\", \"ف\", \"؛\", \"ھ\", \"گ\", \"و\", \"\"]", + "lossless": false + }, + "lmsys/fastchat-t5-3b-v1.0 @ cc100/ja": { + "tokenizer": "fastchat-t5-3b-v1.0", + "organization": "LMSYS", + "vocab_size": 32110, + "_n_bytes": 1774770, + "_n_tokens": 43915, + "_n_chars": 603065, + "_n_oov_chars": 585664, + "oov_ratio": 0.9711457305597241, + "_oov_charset": "[\"窃\", \"模\", \"径\", \"傍\", \"゙\", \"―\", \"置\", \"忙\", \"ぉ\", \"r\", \"尿\", \"愉\", \"徴\", \"裸\", \"遵\", \"妨\", \"蔑\", \"詳\", \"捕\", \"猛\", \"揺\", \"晶\", \"汎\", \"墓\", \"唸\", \"鍋\", \"鹿\", \"不\", \"妥\", \"斑\", \"晒\", \"非\", \"童\", \"粋\", \"腐\", \"歳\", \"ス\", \"迦\", \"▽\", \"ロ\", \"泌\", \"麓\", \"見\", \"舗\", \"眺\", \"濃\", \"へ\", \"尊\", \"悩\", \"淵\", \"ず\", \"郷\", \"訓\", \"前\", \"皿\", \"馬\", \"境\", \"逸\", \"区\", \"練\", \"季\", \"牛\", \"捺\", \"嗜\", \"砦\", \"陥\", \"球\", \"稿\", \"顎\", \"洗\", \"欽\", \"捧\", \"的\", \"Ⅹ\", \"贈\", \"役\", \"婦\", \"激\", \"背\", \"空\", \"殻\", \"套\", \"円\", \"∀\", \"陛\", \"贋\", \"更\", \"譜\", \"津\", \"荻\", \"牲\", \"﨑\", \"獄\", \"六\", \"笠\", \"プ\", \"個\", \"操\", \"臆\", \"土\", \"幼\", \"4\", \"J\", \"庭\", \"蝶\", \"本\", \"版\", \"秋\", \"恐\", \"借\", \"乾\", \"盛\", \"範\", \"倭\", \"塞\", \"憧\", \"障\", \"易\", \"茫\", \"束\", \"梯\", \"裁\", \"錬\", \"修\", \"栽\", \"呑\", \"疾\", \"了\", \"祠\", \"票\", \"羞\", \"ヾ\", \"妊\", \"趨\", \"屓\", \"讐\", \"丈\", \"祖\", \"服\", \"預\", \"便\", \"堪\", \"爆\", \"績\", \"毅\", \"興\", \"恨\", \"猟\", \"聖\", \"魅\", \"傾\", \"糸\", \"符\", \"節\", \"嘗\", \"官\", \"垂\", \"○\", \"痴\", \"苗\", \"恋\", \"仁\", \"頷\", \"ょ\", \"暫\", \"股\", \"五\", \"寿\", \"容\", \"努\", \"移\", \"徊\", \"肺\", \"企\", \"思\", \"摯\", \"届\", \"[\", \"提\", \"滓\", \"叶\", \"煽\", \"劣\", \"流\", \"後\", \"臥\", \"L\", \"令\", \"梶\", \"白\", \"怒\", \"催\", \"嫡\", \"ハ\", \"辣\", \"脅\", \"存\", \"韮\", \"兄\", \"沢\", \"殿\", \"撤\", \"専\", \"昨\", \"衡\", \"撲\", \"伸\", \"氷\", \"咽\", \"韓\", \";\", \"世\", \"匿\", \"洒\", \"交\", \"薩\", \"盆\", \"尚\", \"讃\", \"罵\", \"っ\", \"腔\", \"察\", \"変\", \"材\", \"名\", \"?\", \"逡\", \"肌\", \"就\", \"君\", \"懇\", \"古\", \"守\", \"担\", \"算\", \"棲\", \"篇\", \"汁\", \"画\", \"亮\", \"綬\", \"轄\", \"猿\", \"応\", \"確\", \"布\", \"泥\", \"販\", \"穫\", \"住\", \"妻\", \"形\", \"鼓\", \"麦\", \"潰\", \"日\", \"従\", \"代\", \"昧\", \"捜\", \"ぅ\", \"末\", \"膿\", \"視\", \"怪\", \"遼\", \"失\", \"棒\", \"\", \"咳\", \"酔\", \"緻\", \"桑\", \"訟\", \"垠\", \"期\", \"憎\", \"デ\", \"児\", \"枢\", \"掘\", \"瞳\", \"千\", \"祭\", \"盟\", \"呟\", \"宜\", \"譚\", \"狼\", \"帝\", \"抑\", \"諦\", \"件\", \"浮\", \"監\", \"芳\", \"漢\", \"が\", \"召\", \"拭\", \"民\", \"卓\", \"響\", \"ロ\", \"経\", \"丁\", \"テ\", \"秘\", \"弱\", \"》\", \"嘆\", \"貼\", \"絵\", \"誹\", \"X\", \"素\", \"詰\", \"蓋\", \"瑞\", \"塊\", \"録\", \"備\", \"滅\", \"狩\", \"7\", \"幻\", \"耳\", \"餓\", \"杞\", \"紐\", \"甘\", \"臓\", \"致\", \"曝\", \"郵\", \"頻\", \"喚\", \"焦\", \"請\", \"脆\", \"隙\", \"復\", \"拝\", \"幣\", \"虚\", \"公\", \"漂\", \"花\", \"甥\", \"射\", \"嘲\", \"②\", \"探\", \"陰\", \"翻\", \"叭\", \"ぇ\", \"分\", \"辱\", \"幌\", \"k\", \"倍\", \"徨\", \"港\", \"貸\", \"^\", \"二\", \"恵\", \"班\", \"浩\", \"帯\", \"自\", \"傑\", \"鳴\", \"孝\", \"ル\", \"酬\", \"揄\", \"恭\", \"登\", \"甚\", \"順\", \"械\", \"痛\", \"肪\", \"貯\", \"法\", \"星\", \"尋\", \"∇\", \"話\", \"虜\", \"ゆ\", \"説\", \"雅\", \"告\", \"希\", \"◆\", \"✧\", \"峨\", \"9\", \"亀\", \"厨\", \"ナ\", \"塾\", \"辿\", \"彙\", \"~\", \"賀\", \"慰\", \"滴\", \"友\", \"月\", \"錠\", \"軋\", \"鋲\", \")\", \"伝\", \"難\", \"汗\", \"圏\", \"続\", \"督\", \"喜\", \"向\", \"惨\", \"覆\", \"慌\", \"累\", \"点\", \"秒\", \"嵌\", \"ゾ\", \"\\b\", \"暖\", \"憂\", \"燭\", \"豊\", \"フ\", \"劉\", \"ク\", \"井\", \"ほ\", \"疲\", \"雲\", \"閃\", \"腎\", \"到\", \"↓\", \"さ\", \"梨\", \"旨\", \"信\", \"秤\", \"倫\", \"篤\", \"譲\", \"喰\", \"m\", \"片\", \"由\", \"o\", \"唇\", \"鎖\", \"酒\", \"永\", \"阪\", \"敷\", \"K\", \"ま\", \"弄\", \"逮\", \"よ\", \"S\", \"蔽\", \"常\", \"割\", \"逼\", \"量\", \"吾\", \"独\", \"簗\", \"肘\", \"治\", \"久\", \"胸\", \"廊\", \"侮\", \"恩\", \"華\", \"欺\", \"て\", \"将\", \"雑\", \"ち\", \"十\", \"我\", \"殴\", \"封\", \"偉\", \"E\", \"脂\", \"祇\", \"△\", \"吟\", \"箋\", \"減\", \"忘\", \"盗\", \"昇\", \"例\", \"拾\", \"主\", \"ミ\", \"醐\", \"憩\", \"河\", \"車\", \"紋\", \"婚\", \"ェ\", \"序\", \"F\", \"争\", \"ヨ\", \"薪\", \"ぐ\", \"兆\", \"警\", \"欠\", \"峠\", \"少\", \"雀\", \"挫\", \"党\", \"殺\", \"脈\", \"験\", \"俸\", \"参\", \"受\", \"債\", \"芝\", \"江\", \"談\", \"青\", \"噂\", \"替\", \"訴\", \"併\", \"杖\", \"品\", \"。\", \"焼\", \"岬\", \"ギ\", \"逆\", \"勿\", \"銘\", \"虐\", \"納\", \"維\", \"l\", \"メ\", \"涼\", \"転\", \"剣\", \"運\", \"救\", \"寮\", \"宣\", \"コ\", \"功\", \"褒\", \"カ\", \"越\", \"顕\", \"剰\", \"鍛\", \"匡\", \"愕\", \"時\", \"漬\", \"繊\", \"ぱ\", \"遥\", \"わ\", \"泣\", \"暑\", \"衰\", \"壌\", \"睦\", \"霞\", \"斉\", \"♡\", \"缶\", \"仕\", \"文\", \"程\", \"鎌\", \"狭\", \"漱\", \"Y\", \"ピ\", \"互\", \"療\", \"エ\", \"ュ\", \"凪\", \"む\", \"何\", \"袋\", \"挿\", \"網\", \"航\", \"嘘\", \"枚\", \"\\", \"濯\", \"」\", \"暴\", \"刑\", \"賞\", \"忍\", \"拓\", \"蝋\", \"国\", \"閣\", \"臨\", \"筒\", \"炎\", \"鎮\", \"遙\", \"建\", \"珍\", \"訊\", \"啜\", \"補\", \"犠\", \"噴\", \"均\", \"辞\", \"言\", \"拉\", \"動\", \"恥\", \"物\", \"奏\", \"梓\", \"⌒\", \"纏\", \"巧\", \"國\", \"使\", \"融\", \"唐\", \"注\", \"斗\", \"図\", \"ど\", \"等\", \"輔\", \"舌\", \"悲\", \"開\", \"豪\", \"購\", \" ̄\", \"活\", \"魚\", \"御\", \"輿\", \"優\", \"逐\", \"べ\", \"麺\", \"家\", \"垢\", \"遜\", \"貶\", \"ぴ\", \"宋\", \"詮\", \"唆\", \"祝\", \"髭\", \"吠\", \"灼\", \"縛\", \"๑\", \"窪\", \"か\", \"ォ\", \"底\", \"竜\", \"簿\", \"倉\", \",\", \"木\", \"矢\", \"儀\", \"混\", \"截\", \"身\", \"−\", \"之\", \"苑\", \"婆\", \"膏\", \"張\", \"披\", \"環\", \"低\", \"織\", \"柏\", \"⇔\", \"院\", \"成\", \"較\", \"殲\", \"園\", \"駆\", \"や\", \"拒\", \"頬\", \"距\", \"啓\", \"約\", \"阿\", \"ダ\", \"奴\", \"恒\", \"堵\", \"斡\", \"石\", \"駐\", \"躊\", \"″\", \"迭\", \"極\", \"諏\", \"性\", \"藁\", \"縄\", \"影\", \"菊\", \"冊\", \"寡\", \"磯\", \"須\", \"じ\", \"ム\", \"陸\", \"椒\", \"買\", \"真\", \"風\", \"付\", \"庶\", \"間\", \"示\", \"宗\", \"升\", \"磋\", \"杯\", \"起\", \"《\", \"厄\", \"灘\", \"兎\", \"著\", \"偏\", \"崩\", \"恣\", \"鵜\", \"ブ\", \"慣\", \"蛍\", \"①\", \"多\", \"息\", \"屈\", \"�\", \"終\", \"訃\", \"雰\", \"④\", \"姫\", \"俄\", \"ぎ\", \"腰\", \"畳\", \"覚\", \"層\", \"也\", \"舞\", \"で\", \"ε\", \"油\", \"ゎ\", \"罰\", \"義\", \"圃\", \"坊\", \"冥\", \"匙\", \"飼\", \"-\", \"隅\", \"穀\", \"炒\", \"羽\", \"務\", \"輝\", \"売\", \"彿\", \"辺\", \"寄\", \"訣\", \"ω\", \"料\", \"厚\", \"疑\", \"砕\", \"価\", \"淳\", \"尾\", \"釈\", \"弁\", \"稀\", \"欲\", \"枕\", \"指\", \"律\", \"貞\", \"各\", \"新\", \"ィ\", \"雷\", \"坪\", \"菜\", \"徘\", \"送\", \"脚\", \"坂\", \"鳥\", \"ゼ\", \"舘\", \"廉\", \"彦\", \"諸\", \"再\", \"索\", \"=\", \"冷\", \"\", \"綻\", \"奮\", \"館\", \"連\", \"〜\", \"磨\", \"収\", \"営\", \"レ\", \"元\", \"ぽ\", \"男\", \"夏\", \"資\", \"鋭\", \"蒔\", \"チ\", \"柔\", \"レ\", \"囲\", \"茨\", \"課\", \"礎\", \"又\", \"闘\", \"氏\", \"③\", \"覇\", \"殆\", \"市\", \"岸\", \"週\", \"賠\", \"袖\", \"尖\", \"を\", \"巣\", \"賃\", \"鱈\", \"押\", \"廃\", \"眉\", \"板\", \"i\", \"弓\", \"ノ\", \"騒\", \"氾\", \"埃\", \"様\", \"同\", \"妖\", \"酵\", \"巻\", \"面\", \"良\", \"斂\", \"城\", \"乏\", \"…\", \"配\", \"峰\", \"謄\", \"年\", \"谷\", \"式\", \"読\", \"狂\", \"y\", \"痢\", \"撒\", \"意\", \"妄\", \"血\", \"総\", \"⑩\", \"貝\", \"廻\", \"曰\", \"〆\", \"き\", \"ラ\", \"髪\", \"唄\", \"哀\", \"猶\", \"類\", \"帽\", \"浪\", \"汚\", \"倒\", \"渦\", \"唾\", \"旺\", \"幾\", \"線\", \"彫\", \"喉\", \"審\", \"←\", \"必\", \"政\", \"所\", \"鶴\", \"欣\", \"痒\", \"謂\", \"半\", \"め\", \"う\", \"宝\", \"微\", \"瓶\", \"t\", \"す\", \"ね\", \"潟\", \"依\", \"渕\", \"敵\", \"曲\", \"洞\", \"釜\", \"端\", \"授\", \"講\", \"祈\", \"⻑\", \"痩\", \"眩\", \"斜\", \"称\", \"与\", \"源\", \"瞑\", \"舟\", \"楚\", \"軒\", \"』\", \"諾\", \"僕\", \"慄\", \"村\", \"病\", \"囚\", \"□\", \"尺\", \"梱\", \"萎\", \"丹\", \"毒\", \"化\", \"ィ\", \"還\", \"践\", \"蒸\", \"機\", \"菌\", \"当\", \"香\", \"呆\", \"顧\", \"駒\", \"貫\", \"卒\", \"演\", \"戦\", \"づ\", \"暗\", \"扱\", \"漏\", \"軍\", \"密\", \"削\", \"学\", \"筈\", \"承\", \"マ\", \"粗\", \"険\", \"下\", \"閑\", \"毎\", \"属\", \"拳\", \"亜\", \"工\", \"陽\", \"座\", \"鏡\", \"術\", \"女\", \"ネ\", \"喫\", \"体\", \"た\", \"凌\", \"平\", \"具\", \"双\", \"万\", \"膨\", \"罪\", \"焙\", \"癖\", \"槌\", \"清\", \"O\", \"擁\", \"美\", \"事\", \"客\", \"楼\", \"窒\", \"​\", \"樹\", \"供\", \"邪\", \"悔\", \"寸\", \"百\", \"直\", \"力\", \"紅\", \"洪\", \"ワ\", \"奉\", \"犯\", \"尽\", \"熱\", \"跨\", \"懐\", \"邸\", \"尻\", \"導\", \"口\", \"壬\", \"穴\", \"捩\", \"く\", \"澤\", \"f\", \"労\", \"豚\", \"典\", \"岳\", \"悟\", \"莫\", \"康\", \"獲\", \"継\", \"炉\", \"組\", \"醍\", \"随\", \"太\", \"勤\", \"謎\", \"晴\", \"腑\", \"然\", \"折\", \"情\", \"違\", \"浜\", \"閲\", \"摩\", \"固\", \"準\", \"け\", \"銀\", \"俳\", \"伯\", \"試\", \"獣\", \"増\", \"勇\", \"超\", \"誇\", \"照\", \"己\", \"泡\", \"台\", \"翔\", \"漫\", \"午\", \"制\", \"骨\", \"淫\", \"度\", \"辰\", \"‼\", \"墟\", \"出\", \"能\", \"札\", \"り\", \"ポ\", \"州\", \"透\", \"招\", \"玉\", \"瘍\", \"択\", \"膜\", \"三\", \"解\", \"垣\", \"塔\", \"貌\", \"植\", \"些\", \"̈\", \"玄\", \"電\", \"議\", \"揉\", \"【\", \"姜\", \"進\", \"完\", \"✨\", \"隊\", \"腱\", \"項\", \"征\", \"媛\", \"魔\", \"蛮\", \"沸\", \"遇\", \"剃\", \"H\", \"校\", \"艸\", \"竹\", \"拶\", \"評\", \"抜\", \"括\", \"史\", \"緩\", \"案\", \"掲\", \"妃\", \"嗚\", \"知\", \"墜\", \"権\", \"R\", \"勝\", \"烹\", \"酷\", \"糾\", \"全\", \"器\", \"虹\", \"引\", \"広\", \"嵐\", \"階\", \"岐\", \"珠\", \"延\", \"🌙\", \"為\", \"街\", \"懲\", \"九\", \"ペ\", \"昭\", \"伐\", \"s\", \"共\", \"貢\", \"者\", \"侍\", \"黒\", \"床\", \"踊\", \"援\", \"ボ\", \"過\", \"ニ\", \"馳\", \"針\", \"謡\", \"刻\", \"戚\", \"返\", \"声\", \"親\", \"狐\", \"嶋\", \"打\", \"M\", \"・\", \"洋\", \"■\", \"寝\", \"・\", \"定\", \"羊\", \"究\", \"彷\", \"正\", \"粒\", \"綾\", \"頒\", \"謀\", \"「\", \"「\", \"推\", \"払\", \"D\", \"求\", \"災\", \"旧\", \"利\", \"俊\", \"巨\", \"父\", \"好\", \"番\", \"擦\", \"攻\", \"俯\", \"号\", \"藤\", \"は\", \"如\", \"格\", \"妬\", \"因\", \"攘\", \"Q\", \"歌\", \"集\", \"栗\", \"怠\", \"醸\", \"】\", \"ッ\", \"ョ\", \"萼\", \"水\", \"弾\", \"帳\", \"粘\", \"実\", \"麗\", \"い\", \"員\", \"房\", \"و\", \"問\", \"黙\", \"ヤ\", \"契\", \"討\", \"碌\", \"摂\", \"博\", \"〈\", \"匹\", \"賢\", \"挙\", \"迅\", \"杼\", \"和\", \"衷\", \"省\", \"刊\", \"診\", \"光\", \"副\", \"池\", \"費\", \"裏\", \"輸\", \"迫\", \"聾\", \"留\", \"概\", \"勉\", \"😊\", \"℃\", \"臭\", \"麹\", \"😌\", \"途\", \"排\", \"郎\", \"記\", \"芸\", \"坐\", \"心\", \"腕\", \"造\", \"爪\", \"宮\", \"矛\", \"願\", \"核\", \"革\", \"*\", \"師\", \"複\", \"佇\", \"ノ\", \"道\", \"循\", \"枯\", \"横\", \"梳\", \"絶\", \"肝\", \"函\", \"撫\", \"霧\", \"跡\", \"塵\", \"允\", \"智\", \"躍\", \"管\", \"観\", \"筆\", \"掻\", \"寂\", \"吹\", \"稲\", \"屋\", \"疇\", \"対\", \"載\", \"咲\", \"逃\", \"該\", \"根\", \"海\", \"望\", \"怨\", \"碓\", \"語\", \"仙\", \"領\", \"短\", \"▼\", \"大\", \"得\", \"挨\", \"擢\", \"堂\", \"杏\", \"→\", \"襲\", \"僭\", \"壇\", \"理\", \"捗\", \"昼\", \"音\", \"浸\", \"崎\", \"研\", \"斎\", \"題\", \"姦\", \"在\", \"戒\", \"囁\", \"印\", \"◡\", \"護\", \"暁\", \"熊\", \"仏\", \"賑\", \"店\", \"蔓\", \"鞘\", \"彡\", \"葵\", \"礼\", \"◎\", \"患\", \"蓮\", \"\\u001b\", \"蒙\", \"綱\", \"謝\", \"宛\", \"才\", \"ふ\", \"適\", \"睡\", \"%\", \"換\", \"燃\", \"来\", \"色\", \"抽\", \"映\", \"|\", \"珂\", \"残\", \"棄\", \"び\", \"机\", \"壁\", \"凄\", \"濡\", \"速\", \"バ\", \"停\", \"最\", \"陳\", \"胞\", \"丘\", \"榴\", \"積\", \"叩\", \"蛋\", \"脱\", \"子\", \"鼻\", \"立\", \"隼\", \"悪\", \"ゞ\", \".\", \"壮\", \"溜\", \"般\", \"枠\", \"軌\", \"I\", \"ガ\", \"舎\", \"被\", \"答\", \"米\", \"$\", \"揮\", \"促\", \"吐\", \"拡\", \"昂\", \"惹\", \"戯\", \"央\", \"通\", \"1\", \"許\", \"凱\", \"喋\", \"庫\", \"値\", \"癒\", \"突\", \"喪\", \"『\", \"天\", \"徳\", \"托\", \"龍\", \"蓄\", \"控\", \"故\", \"ヒ\", \"野\", \"忠\", \"嬢\", \"奇\", \"拘\", \"奔\", \"そ\", \"亡\", \"列\", \"庄\", \"💦\", \"手\", \"隆\", \"娠\", \"捨\", \"渡\", \"頑\", \"志\", \"健\", \"無\", \"孫\", \"ド\", \"振\", \"諺\", \"感\", \"想\", \"膚\", \"伊\", \"母\", \"関\", \"待\", \"且\", \"拷\", \"込\", \"縦\", \"地\", \"晩\", \"武\", \"柄\", \"赴\", \"溶\", \"斧\", \"+\", \"行\", \"靴\", \"魏\", \"袴\", \"窟\", \"糞\", \"圧\", \"頓\", \"奥\", \"絨\", \"崔\", \"沼\", \"梅\", \"ぜ\", \"駿\", \"硝\", \"箇\", \"近\", \"駅\", \"伺\", \"盤\", \"艶\", \"〇\", \"勧\", \"励\", \"益\", \"云\", \"析\", \"脇\", \"渇\", \"像\", \"漠\", \"税\", \"暢\", \"純\", \"損\", \"灌\", \"げ\", \"ヲ\", \"籠\", \"潤\", \"夫\", \"託\", \"橋\", \"攫\", \"並\", \"席\", \"欧\", \"畜\", \"ソ\", \"6\", \"饉\", \"僧\", \"箭\", \"晋\", \"曜\", \"闇\", \"捲\", \"☆\", \"態\", \"帰\", \"証\", \"標\", \"袈\", \"毛\", \"紛\", \"]\", \"掌\", \"喩\", \"乞\", \"涯\", \"モ\", \"ヘ\", \"止\", \"訪\", \"未\", \"添\", \"規\", \"財\", \"脳\", \"賊\", \"ツ\", \"荷\", \"痕\", \"狙\", \"紙\", \"乗\", \"燥\", \"念\", \"腺\", \"慮\", \"汲\", \"匂\", \"群\", \"夜\", \"塗\", \"渋\", \"肉\", \"泰\", \"g\", \"普\", \"瓦\", \"⑪\", \"貿\", \"奨\", \"第\", \"福\", \"夷\", \"庇\", \"挟\", \"做\", \"作\", \"夢\", \"額\", \"パ\", \"善\", \"凡\", \"執\", \"把\", \"商\", \"誠\", \"湧\", \"春\", \"_\", \"界\", \"盾\", \"敗\", \"侵\", \"遽\", \"😭\", \"支\", \"胚\", \"耕\", \"ろ\", \"絞\", \"林\", \"浄\", \"耗\", \"❤\", \"落\", \"堀\", \"覧\", \"躇\", \"稼\", \"C\", \"比\", \"暇\", \"蠍\", \"昆\", \"搬\", \"句\", \"疫\", \"。\", \"威\", \"餃\", \"h\", \":\", \"蜂\", \"場\", \"編\", \"猫\", \"寛\", \"Д\", \"抹\", \"煎\", \"隕\", \"朴\", \"礁\", \"踪\", \"老\", \"笑\", \"郡\", \"堺\", \"詠\", \"踏\", \"堆\", \"銃\", \"調\", \"人\", \"烈\", \"蹴\", \"勲\", \"A\", \"縫\", \"ア\", \"凛\", \"3\", \"烙\", \"歴\", \"四\", \"現\", \"冒\", \"詈\", \"慎\", \"施\", \"俗\", \"秀\", \"握\", \"明\", \"(\", \"ヴ\", \"瞬\", \"嫁\", \"琵\", \"抗\", \"足\", \"種\", \"灯\", \"シ\", \"徹\", \"科\", \"沈\", \"兵\", \"堡\", \"小\", \"ヨ\", \"誉\", \"快\", \"腸\", \"拗\", \"ひ\", \"構\", \"苦\", \"溢\", \"佐\", \"株\", \"是\", \"胃\", \"遂\", \"賭\", \"包\", \"級\", \"即\", \"吉\", \"温\", \"醜\", \"県\", \"誕\", \"<\", \"棚\", \"有\", \"゚\", \"戴\", \"億\", \"於\", \"V\", \"の\", \"統\", \"揃\", \"漁\", \"⑧\", \"若\", \"¥\", \"貴\", \"薦\", \"異\", \"泊\", \"捉\", \"伽\", \"紀\", \"稜\", \"タ\", \"祐\", \"祀\", \"至\", \"鯖\", \"ビ\", \"〕\", \"条\", \"棟\", \"精\", \"協\", \"´\", \"欝\", \"顔\", \"隣\", \"北\", \"犬\", \"贅\", \"樺\", \"散\", \"〔\", \"擬\", \"滋\", \"闖\", \"叱\", \"相\", \"ト\", \"訳\", \"盲\", \"桟\", \"n\", \"液\", \"お\", \"部\", \"、\", \"症\", \"養\", \"私\", \"締\", \"刀\", \"申\", \"薄\", \"農\", \"‐\", \"飲\", \"魂\", \"嶽\", \"岡\", \"遣\", \"懸\", \"蔵\", \"葬\", \"遡\", \"鉱\", \"休\", \"豆\", \"桁\", \"趣\", \"鍵\", \"穂\", \"ヘ\", \"メ\", \"あ\", \"丸\", \"〉\", \"揚\", \"羨\", \"涙\", \"播\", \"餅\", \"段\", \"甲\", \"枝\", \"ン\", \"浅\", \"弊\", \"ヶ\", \"B\", \"惣\", \"噛\", \"鮮\", \"批\", \"露\", \"遺\", \"首\", \"川\", \"ぶ\", \"繁\", \"簡\", \"呂\", \"採\", \"表\", \"外\", \"傲\", \"邦\", \"※\", \"丿\", \"飯\", \"眠\", \"路\", \"貪\", \"怯\", \"彼\", \"彩\", \"皮\", \"飽\", \"恰\", \"も\", \"秩\", \"論\", \"俺\", \"ァ\", \"東\", \"宅\", \"旗\", \"、\", \"徐\", \"扉\", \"這\", \"癌\", \"醤\", \"陵\", \"刃\", \"会\", \"給\", \"雨\", \"d\", \"冨\", \"退\", \"誘\", \"̀\", \"職\", \"士\", \"穢\", \"蛇\", \"差\", \"乃\", \"汰\", \"歓\", \"裾\", \"享\", \"絡\", \"澄\", \"宏\", \"去\", \"旦\", \"ヌ\", \"凝\", \"!\", \"効\", \"侶\", \"衣\", \"鉄\", \"迷\", \"雄\", \"肥\", \"仮\", \"沖\", \"南\", \"斬\", \"両\", \"艦\", \"町\", \"@\", \"破\", \"愛\", \"彌\", \"惚\", \"胆\", \"媚\", \"募\", \"殊\", \"景\", \"仰\", \"巷\", \"栃\", \"T\", \"填\", \"書\", \"↑\", \"★\", \"投\", \"冬\", \"署\", \"腹\", \"吸\", \"湿\", \"掬\", \"寺\", \"沿\", \"菓\", \"暦\", \"衆\", \"鞄\", \"Ⅶ\", \"れ\", \"策\", \"幡\", \"仲\", \"る\", \"湖\", \"纒\", \"槍\", \"痺\", \"李\", \"セ\", \"困\", \"履\", \"煙\", \"椿\", \"赤\", \"掃\", \"団\", \"オ\", \"▷\", \"舐\", \"富\", \"ぃ\", \"錯\", \"慶\", \"♫\", \"憲\", \"敏\", \"フ\", \"昔\", \"テ\", \"詩\", \"ぬ\", \"旬\", \"満\", \"拙\", \"紹\", \"梁\", \"餌\", \"頃\", \"膝\", \"亭\", \"雇\", \"́\", \"嫌\", \"聴\", \"昏\", \"笛\", \"急\", \"壊\", \"⇒\", \"他\", \"驚\", \"幽\", \"帆\", \"阜\", \"状\", \"賛\", \"凶\", \"衛\", \"姉\", \"惧\", \"誓\", \"ジ\", \"Z\", \"鬼\", \"ヽ\", \"遍\", \"軟\", \"衝\", \"以\", \"墾\", \"祉\", \"摘\", \"処\", \"派\", \"◯\", \"銭\", \"埋\", \"寇\", \"ゃ\", \"及\", \"荘\", \"鉛\", \"撰\", \"波\", \"偶\", \"繍\", \"肩\", \"訝\", \"飢\", \"嘩\", \"嵯\", \"禁\", \"炭\", \"謬\", \"繋\", \"桃\", \"媒\", \"潔\", \"謳\", \"傷\", \"拠\", \"慢\", \"撮\", \"寧\", \"栄\", \"述\", \"旋\", \"腫\", \"責\", \"誤\", \"往\", \"靄\", \"慨\", \"金\", \"謙\", \"合\", \"郭\", \"柱\", \"0\", \"設\", \"唯\", \"鐘\", \"桜\", \"充\", \"迎\", \"競\", \"稚\", \"償\", \"捏\", \"茶\", \"刺\", \"輪\", \"抵\", \"測\", \"闊\", \"細\", \"々\", \"鈍\", \"キ\", \"気\", \"歩\", \"側\", \"展\", \"紗\", \"刷\", \"伴\", \"略\", \"悶\", \"葉\", \"遠\", \"況\", \"強\", \"濫\", \"遊\", \"認\", \"助\", \"礫\", \"那\", \"虎\", \"浣\", \"ズ\", \"草\", \"果\", \"宙\", \"培\", \"阻\", \"捐\", \"英\", \"篠\", \"乙\", \"Ⅱ\", \"旅\", \"選\", \"㎞\", \"β\", \"却\", \"G\", \"幕\", \"胎\", \"婿\", \"可\", \"肯\", \"閉\", \"こ\", \"窓\", \"渉\", \"杉\", \"糧\", \"畑\", \"居\", \"介\", \"拍\", \"肢\", \"埼\", \"杜\", \"コ\", \"湾\", \"串\", \"湯\", \"薙\", \"硬\", \"嵩\", \"楽\", \"桂\", \"火\", \"局\", \"騙\", \"裕\", \"抱\", \"神\", \"衿\", \"改\", \"深\", \"¥\", \"泄\", \"牽\", \"妹\", \"命\", \"沙\", \"゙\", \"峙\", \"貨\", \"◇\", \"~\", \"8\", \"咎\", \"遅\", \"報\", \"初\", \"医\", \"ん\", \"或\", \"検\", \"断\", \"搭\", \"軸\", \"/\", \"ー\", \"係\", \"先\", \"祥\", \"耶\", \"船\", \"覗\", \"ャ\", \"始\", \"佳\", \"哲\", \"姓\", \"2\", \"ぁ\", \"愚\", \"降\", \"厭\", \"N\", \"描\", \"宇\", \"七\", \"跳\", \"瀬\", \"巾\", \"滲\", \"孤\", \"皆\", \"陶\", \"塩\", \"瞭\", \"窮\", \"着\", \"噌\", \"駕\", \"湘\", \"除\", \"緒\", \"騰\", \"厳\", \"尼\", \"築\", \"西\", \"逢\", \"煩\", \"頼\", \"涅\", \"詐\", \"馴\", \"躾\", \"考\", \"紡\", \"免\", \"ケ\", \"傘\", \"数\", \"質\", \"リ\", \"楊\", \"予\", \"梗\", \"域\", \"罠\", \"敬\", \"─\", \"墳\", \"蘇\", \"済\", \"縞\", \"な\", \"揶\", \"際\", \"鴻\", \"回\", \"a\", \"ゲ\", \"灰\", \"゚\", \"朝\", \"技\", \"繰\", \"保\", \"穏\", \"製\", \"澪\", \"悍\", \"ウ\", \"莽\", \"没\", \"用\", \"旭\", \"占\", \"ご\", \"筋\", \"早\", \"負\", \"潮\", \"疎\", \"酸\", \"輩\", \"楓\", \"働\", \"産\", \"曖\", \"×\", \"鉢\", \"附\", \"爾\", \"カ\", \"上\", \"グ\", \"門\", \"琉\", \"姑\", \"奪\", \"券\", \"只\", \"発\", \"ウ\", \"籍\", \"王\", \"取\", \"寓\", \"●\", \"ホ\", \"仔\", \"娘\", \"目\", \"死\", \"©\", \"軽\", \"冗\", \"装\", \"緯\", \"章\", \"教\", \"杓\", \"方\", \"率\", \"μ\", \"ハ\", \"♪\", \"欄\", \"謗\", \"淡\", \"候\", \"ユ\", \"育\", \"創\", \">\", \"貧\", \"喇\", \"暮\", \"次\", \"檀\", \"姥\", \"象\", \"サ\", \"浴\", \"寒\", \"中\", \"牧\", \"結\", \"岩\", \"ア\", \"長\", \"幹\", \"勘\", \"緑\", \"山\", \"熟\", \"翌\", \"&\", \"今\", \"貰\", \"U\", \"追\", \"基\", \"琳\", \"嚥\", \"雪\", \"堅\", \"琴\", \"位\", \"楠\", \"嫉\", \"隔\", \"安\", \"〟\", \"疹\", \"ザ\", \"︎\", \"放\", \"嗅\", \"綺\", \"泳\", \"鬱\", \"憤\", \"生\", \"高\", \"b\", \"族\", \"ゅ\", \"原\", \"持\", \"虫\", \"偽\", \"ぼ\", \"偵\", \"島\", \"妙\", \"丼\", \"e\", \"瓢\", \"崖\", \"喝\", \"姿\", \"俵\", \"習\", \"兼\", \"渓\", \"赦\", \"似\", \"忽\", \"娯\", \"惜\", \"釘\", \"ば\", \"危\", \"ヵ\", \"別\", \"轢\", \"茂\", \"ゝ\", \"震\", \"判\", \"槽\", \"害\", \"堰\", \"儲\", \"里\", \"噤\", \"都\", \"奢\", \"左\", \"齢\", \"み\", \"耐\", \"触\", \"聞\", \"絆\", \"叫\", \"漑\", \"w\", \"泉\", \"椅\", \"要\", \"曽\", \"綴\", \"右\", \"否\", \"ㅂ\", \"整\", \"苛\", \"匠\", \"5\", \"染\", \"と\", \"勢\", \"接\", \"任\", \"字\", \"曹\", \"粉\", \"反\", \"室\", \"据\", \"巡\", \"縮\", \"措\", \"乱\", \"看\", \"既\", \"弟\", \"浦\", \"糖\", \"誰\", \"単\", \"防\", \"但\", \"決\", \"麻\", \"隈\", \"‥\", \"卵\", \"写\", \"飴\", \"`\", \" \", \"槃\", \"瘻\", \"淹\", \"碍\", \"堤\", \"琶\", \"栓\", \"菅\", \"塚\", \"ゴ\", \"避\", \"鶏\", \"滝\", \"惑\", \"僅\", \"釣\", \"系\", \"潜\", \"献\", \"切\", \"入\", \"イ\", \"喧\", \"社\", \"宿\", \"型\", \"離\", \"縁\", \"え\", \"珪\", \"隠\", \"夕\", \"紫\", \"嬉\", \"剥\", \"羅\", \"含\", \"歪\", \"牙\", \"だ\", \"凍\", \"唱\", \"干\", \"贔\", \"ぞ\", \"裟\", \"滑\", \"角\", \"悠\", \"綜\", \"訂\", \"掛\", \"屹\", \"ぷ\", \"乳\", \"田\", \"余\", \"荒\", \"ー\", \"幅\", \"詫\", \"爽\", \"滞\", \"劇\", \"皇\", \"霊\", \"走\", \"伏\", \"掴\", \"飾\", \"ゥ\", \"應\", \"藻\", \"朗\", \"戻\", \"憑\", \"粧\", \"限\", \"〝\", \"司\", \"識\", \"詞\", \"徒\", \"叉\", \"携\", \"陣\", \"挑\", \"頂\", \"周\", \"砂\", \"卑\", \"つ\", \"食\", \"ゥ\", \"曇\", \"洩\", \"一\", \"歯\", \"府\", \"に\", \"臣\", \"業\", \"弥\", \"緊\", \"翼\", \"味\", \"彰\", \"京\", \"宴\", \"ざ\", \"せ\", \"静\", \"委\", \"需\", \"」\", \"内\", \"特\", \"呼\", \"箱\", \"撃\", \"慈\", \"査\", \"眼\", \"僚\", \"し\", \"憶\", \"P\", \"頭\", \"幸\", \"鈴\", \"怖\", \"架\", \"ら\", \"駄\", \"飛\", \"八\", \"リ\", \"ベ\", \"戸\", \"璧\", \"松\", \"薬\", \"殖\", \"消\", \"重\", \"剤\", \"W\", \"庁\", \"加\", \"誌\", \"斐\", \"裂\", \"鑑\", \"琢\", \"黄\", \"煮\", \"計\", \"則\", \"克\", \"辛\", \"😢\", \"達\", \"遭\", \"森\", \"奈\", \"某\", \"忌\"]", + "lossless": false + }, + "lmsys/fastchat-t5-3b-v1.0 @ cc100/ko": { + "tokenizer": "fastchat-t5-3b-v1.0", + "organization": "LMSYS", + "vocab_size": 32110, + "_n_bytes": 1524839, + "_n_tokens": 474953, + "_n_chars": 655190, + "_n_oov_chars": 432679, + "oov_ratio": 0.6603870632946168, + "_oov_charset": "[\"윈\", \"드\", \"―\", \"呪\", \"싣\", \"譯\", \"칵\", \"섯\", \"🥁\", \"·\", \"미\", \"을\", \"펌\", \"싶\", \"퀘\", \"뭇\", \"不\", \"묘\", \"폭\", \"룡\", \"훔\", \"童\", \"츈\", \"😗\", \"ㅙ\", \"Ⅲ\", \"잣\", \"른\", \"밀\", \"및\", \"근\", \"붉\", \"훑\", \"액\", \"껍\", \"參\", \"샴\", \"린\", \"업\", \"맙\", \"빵\", \"힐\", \"쫀\", \"푹\", \"꺽\", \"얻\", \"└\", \"的\", \"Ⅹ\", \"믐\", \"쁨\", \"궤\", \"남\", \"햇\", \"숲\", \"밋\", \"ㅁ\", \"유\", \"津\", \"늘\", \"荻\", \"뵙\", \"돼\", \"네\", \"六\", \"笠\", \"某\", \"은\", \"넨\", \"쥔\", \"듭\", \"土\", \"륜\", \"秋\", \"특\", \"룹\", \"댈\", \"ㅕ\", \"️\", \"힘\", \"易\", \"핏\", \"억\", \"겁\", \"딜\", \"榮\", \"🍞\", \"깥\", \"ᴄ\", \"修\", \"앨\", \"위\", \"푼\", \"툼\", \"콩\", \"왼\", \"뗀\", \"음\", \"결\", \"專\", \"聖\", \"節\", \"○\", \"낮\", \"ㄱ\", \"구\", \"仁\", \"⁴\", \"작\", \"五\", \"눔\", \"♣\", \"金\", \"禮\", \"◦\", \"팀\", \"넓\", \"☞\", \"쬐\", \"ㅇ\", \"思\", \"경\", \"득\", \"덥\", \"쩌\", \"㉰\", \"벚\", \"臥\", \"後\", \"쪄\", \"얍\", \"켓\", \"닫\", \"白\", \"송\", \"💸\", \"톤\", \"存\", \"혀\", \"兄\", \"卽\", \"폼\", \"듯\", \"茅\", \"衡\", \"팥\", \"氷\", \"멜\", \"포\", \"읽\", \"맵\", \"韓\", \"굉\", \"世\", \"껏\", \"괄\", \"交\", \"셀\", \"속\", \"잎\", \"촨\", \"다\", \"례\", \"킵\", \"듣\", \"펀\", \"⋅\", \"컴\", \"?\", \"친\", \"풀\", \"君\", \"ã\", \"古\", \"챗\", \"守\", \"짱\", \"목\", \"겟\", \"넣\", \"랬\", \"🤕\", \"란\", \"온\", \"튿\", \"ㅓ\", \"布\", \"쌍\", \"같\", \"妻\", \"본\", \"日\", \"Ⅰ\", \"벨\", \"代\", \"이\", \"승\", \"죤\", \"앰\", \"밧\", \"칫\", \"쓰\", \"먼\", \"뿔\", \"픈\", \"투\", \"련\", \"로\", \"즙\", \"객\", \"뻔\", \"잇\", \"놓\", \"콰\", \"盟\", \"캄\", \"륭\", \"팡\", \"帝\", \"맴\", \"긁\", \"싱\", \"좋\", \"👍\", \"북\", \"쉘\", \"틋\", \"漢\", \"갖\", \"증\", \"쌀\", \"民\", \"뒷\", \"캔\", \"펩\", \"뵐\", \"풋\", \"➎\", \"밍\", \"렘\", \"👋\", \"표\", \"럼\", \"쐐\", \"손\", \"》\", \"덴\", \"묻\", \"滅\", \"훠\", \"致\", \"꺼\", \"밌\", \"뛰\", \"마\", \"협\", \"公\", \"射\", \"맨\", \"잊\", \"휘\", \"격\", \"②\", \"陰\", \"➊\", \"눕\", \"낍\", \"侯\", \"벳\", \"ㅈ\", \"냄\", \"分\", \"펑\", \"햄\", \"♧\", \"갭\", \"멤\", \"貸\", \"디\", \"캣\", \"춘\", \"뜯\", \"孝\", \"自\", \"팟\", \"法\", \"星\", \"낱\", \"각\", \"◆\", \"뽐\", \"뭘\", \"깽\", \"뉘\", \"빕\", \"텔\", \"~\", \"용\", \"준\", \"빔\", \"友\", \"쾅\", \"ㅜ\", \"月\", \"에\", \"밝\", \"뜹\", \"며\", \"록\", \"눌\", \"왜\", \"ㅎ\", \"ㅍ\", \"념\", \"뭐\", \"그\", \"러\", \"텍\", \"옷\", \"向\", \"곳\", \"覆\", \"테\", \"엇\", \"믿\", \"룩\", \"뭔\", \"💰\", \"만\", \"燭\", \"즘\", \"끄\", \"섬\", \"염\", \"럭\", \"명\", \"왁\", \"엡\", \"섣\", \"雲\", \"↓\", \"슨\", \"랄\", \"ㅠ\", \"눅\", \"信\", \"즉\", \"빛\", \"치\", \"호\", \"찰\", \"별\", \"성\", \"핸\", \"齋\", \"씌\", \"식\", \"永\", \"촘\", \"♀\", \"떤\", \"딱\", \"완\", \"⑥\", \"常\", \"왕\", \"治\", \"샷\", \"꾸\", \"시\", \"섰\", \"설\", \"華\", \"て\", \"씨\", \"얇\", \"냐\", \"十\", \"뽀\", \"♥\", \"힉\", \"△\", \"슝\", \"듬\", \"主\", \"최\", \"±\", \"🦄\", \"향\", \"숫\", \"紋\", \"婚\", \"잴\", \"케\", \"序\", \"떄\", \"팎\", \"합\", \"몸\", \"ㅊ\", \"警\", \"옥\", \"애\", \"殺\", \"춤\", \"쾨\", \"찜\", \"江\", \"맞\", \"현\", \"수\", \"카\", \"땐\", \"。\", \"암\", \"갱\", \"꺄\", \"힌\", \"볕\", \"戌\", \"뜩\", \"낌\", \"짙\", \"삿\", \"짖\", \"💡\", \"베\", \"져\", \"뜬\", \"삘\", \"壽\", \"∮\", \"씹\", \"웨\", \"횡\", \"팅\", \"막\", \"時\", \"떳\", \"끊\", \"웁\", \"딛\", \"보\", \"챌\", \"롯\", \"♡\", \"릿\", \"눴\", \"文\", \"程\", \"난\", \"력\", \"곶\", \"何\", \"패\", \"많\", \"바\", \"센\", \"캉\", \"게\", \"춧\", \"창\", \"탰\", \"」\", \"병\", \"므\", \"없\", \"깜\", \"黃\", \"쏟\", \"쳇\", \"맡\", \"홉\", \"안\", \"당\", \"언\", \"겐\", \"찔\", \"궜\", \"좆\", \"言\", \"꽂\", \"動\", \"홈\", \"돌\", \"쉴\", \"둔\", \"광\", \"렐\", \"國\", \"緞\", \"몽\", \"죄\", \"唐\", \"斗\", \"습\", \"루\", \"좁\", \"상\", \"濟\", \"솜\", \"틈\", \"魚\", \"御\", \"워\", \"닐\", \"퀵\", \"댄\", \"낳\", \"밟\", \"家\", \"⑸\", \"쥰\", \"宋\", \"플\", \"튬\", \"뷰\", \"겸\", \"괜\", \"굿\", \"줬\", \"휙\", \"역\", \"≤\", \"∙\", \"끌\", \"吳\", \"텅\", \"채\", \"렴\", \"겨\", \"之\", \"곽\", \"파\", \"첫\", \"공\", \"겹\", \"야\", \"院\", \"藥\", \"對\", \"짚\", \"기\", \"뎀\", \"屠\", \"끼\", \"짠\", \"슬\", \"駐\", \"쏭\", \"깁\", \"極\", \"性\", \"또\", \"콕\", \"티\", \"魯\", \"꿨\", \"션\", \"첼\", \"싹\", \"🦅\", \"◼\", \"김\", \"뉜\", \"얕\", \"뒀\", \"間\", \"宗\", \"롱\", \"둬\", \"《\", \"휠\", \"ㅞ\", \"삽\", \"①\", \"多\", \"렸\", \"�\", \"\", \"④\", \"함\", \"✔\", \"썸\", \"곱\", \"께\", \"罰\", \"똥\", \"늦\", \"ᴀ\", \"비\", \"중\", \"류\", \"웰\", \"將\", \"융\", \"穀\", \"환\", \"췄\", \"해\", \"콘\", \"女\", \"새\", \"💌\", \"쥐\", \"뻑\", \"섞\", \"홋\", \"ω\", \"쎄\", \"料\", \"굶\", \"껑\", \"튜\", \"큰\", \"㎥\", \"잦\", \"폿\", \"멕\", \"샌\", \"듀\", \"척\", \"🗺\", \"新\", \"쿵\", \"받\", \"밤\", \"▶\", \"걍\", \"썹\", \"빼\", \"았\", \"백\", \"런\", \"敎\", \"품\", \"길\", \"름\", \"원\", \"男\", \"킨\", \"빤\", \"資\", \"까\", \"랩\", \"ᴛ\", \"⑴\", \"걷\", \"課\", \"섭\", \"릎\", \"짝\", \"꿰\", \"③\", \"⑨\", \"틱\", \"혐\", \"했\", \"는\", \"툴\", \"劍\", \"짭\", \"씩\", \"덮\", \"교\", \"문\", \"한\", \"딤\", \"끝\", \"취\", \"활\", \"琪\", \"큼\", \"탈\", \"빚\", \"옐\", \"同\", \"☀\", \"ㄷ\", \"림\", \"둡\", \"군\", \"능\", \"面\", \"롤\", \"빅\", \"불\", \"城\", \"…\", \"촬\", \"峰\", \"年\", \"戊\", \"전\", \"Ⅳ\", \"谷\", \"높\", \"셈\", \"意\", \"샹\", \"淨\", \"흉\", \"曰\", \"뜰\", \"딴\", \"💕\", \"앱\", \"觸\", \"흩\", \"퇴\", \"哀\", \"켐\", \"들\", \"냥\", \"꿍\", \"類\", \"➋\", \"족\", \"롬\", \"둥\", \"←\", \"끽\", \"政\", \"所\", \"고\", \"끙\", \"꼴\", \"갚\", \"ㅒ\", \"찮\", \"쇼\", \"항\", \"す\", \"ㅔ\", \"洞\", \"양\", \"授\", \"쎈\", \"燦\", \"무\", \"롸\", \"행\", \"말\", \"軒\", \"』\", \"□\", \"病\", \"堯\", \"ㅚ\", \"브\", \"둠\", \"때\", \"꿔\", \"毒\", \"뤄\", \"쿠\", \"化\", \"셋\", \"익\", \"릴\", \"깨\", \"機\", \"빴\", \"經\", \"꿈\", \"궁\", \"쫓\", \"卒\", \"槪\", \"대\", \"軍\", \"묶\", \"렬\", \"든\", \"낀\", \"셨\", \"下\", \"內\", \"工\", \"램\", \"🔹\", \"쩔\", \"陽\", \"레\", \"밸\", \"앎\", \"윌\", \"평\", \"術\", \"女\", \"뀔\", \"곧\", \"앤\", \"씀\", \"텐\", \"平\", \"좀\", \"셔\", \"쉼\", \"團\", \"략\", \"범\", \"횟\", \"美\", \"낭\", \"쟤\", \"옌\", \"납\", \"려\", \"퍙\", \"客\", \"事\", \"쁠\", \"악\", \"웖\", \"​\", \"숭\", \"〮\", \"썰\", \"탭\", \"樹\", \"트\", \"졸\", \"띈\", \"긋\", \"릇\", \"百\", \"아\", \"랭\", \"됐\", \"예\", \"直\", \"갤\", \"찬\", \"초\", \"假\", \"奉\", \"켰\", \"민\", \"쨌\", \"홍\", \"않\", \"口\", \"갯\", \"갑\", \"켠\", \"典\", \"ㅑ\", \"悧\", \"🍕\", \"康\", \"리\", \"거\", \"렜\", \"뺐\", \"귈\", \"혼\", \"烏\", \"숱\", \"첨\", \"➍\", \"간\", \"巳\", \"然\", \"녜\", \"덩\", \"얘\", \"情\", \"허\", \"摩\", \"딪\", \"銀\", \"뮐\", \"캠\", \"詔\", \"꼭\", \"賣\", \"🤔\", \"똑\", \"🏫\", \"래\", \"己\", \"💥\", \"훗\", \"㉿\", \"곡\", \"킁\", \"돠\", \"👨\", \"뻗\", \"낡\", \"制\", \"탓\", \"關\", \"회\", \"辰\", \"됩\", \"能\", \"出\", \"댔\", \"젠\", \"열\", \"훌\", \"價\", \"혔\", \"섹\", \"펼\", \"玉\", \"三\", \"解\", \"핵\", \"숍\", \"법\", \"빌\", \"릅\", \"【\", \"姜\", \"임\", \"꾼\", \"탑\", \"휩\", \"데\", \"理\", \"된\", \"헨\", \"옹\", \"ㅖ\", \"앵\", \"짬\", \"魔\", \"쁜\", \"뿍\", \"쩐\", \"옛\", \"㉠\", \"竹\", \"쯤\", \"좌\", \"ㅟ\", \"史\", \"ㅆ\", \"땅\", \"❏\", \"知\", \"녕\", \"흑\", \"⬇\", \"어\", \"全\", \"씬\", \"관\", \"솥\", \"發\", \"닙\", \"돈\", \"팝\", \"累\", \"퓰\", \"봤\", \"홀\", \"냉\", \"九\", \"움\", \"좇\", \"욱\", \"쫑\", \"컷\", \"캘\", \"탐\", \"s\", \"昭\", \"共\", \"굽\", \"응\", \"앉\", \"者\", \"휴\", \"큽\", \"싫\", \"줘\", \"톨\", \"識\", \"님\", \"퀄\", \"라\", \"헝\", \"짧\", \"■\", \"洋\", \"참\", \"・\", \"흠\", \"ᴇ\", \"생\", \"뚜\", \"正\", \"컵\", \"꿕\", \"ᴍ\", \"맑\", \"「\", \"췌\", \"희\", \"「\", \"廟\", \"왘\", \"戮\", \"求\", \"닷\", \"利\", \"넉\", \"好\", \"渴\", \"감\", \"は\", \"²\", \"킥\", \"學\", \"눈\", \"댁\", \"힙\", \"꺾\", \"겠\", \"集\", \"🤗\", \"클\", \"】\", \"폄\", \"水\", \"쫒\", \"꽁\", \"첸\", \"い\", \"빠\", \"員\", \"房\", \"박\", \"뤘\", \"켜\", \"跏\", \"〈\", \"샬\", \"곁\", \"릉\", \"和\", \"동\", \"번\", \"光\", \"랍\", \"副\", \"측\", \"뮬\", \"띠\", \"留\", \"‪\", \"저\", \"빈\", \"뾱\", \"궈\", \"훼\", \"😊\", \"ⅲ\", \"얏\", \"퓨\", \"℃\", \"꿀\", \"途\", \"컨\", \"坐\", \"듐\", \"心\", \"배\", \"갈\", \"났\", \"몇\", \"宮\", \"뛴\", \"처\", \"폰\", \"革\", \"*\", \"렌\", \"\", \"師\", \"땡\", \"道\", \"잘\", \"턱\", \"픔\", \"枯\", \"꽉\", \"샤\", \"⑵\", \"🙆\", \"균\", \"實\", \"獻\", \"낄\", \"뱃\", \"즐\", \"닭\", \"管\", \"청\", \"숙\", \"悖\", \"붐\", \"연\", \"쁘\", \"載\", \"➌\", \"옆\", \"락\", \"邑\", \"海\", \"望\", \"켈\", \"낚\", \"語\", \"蜀\", \"크\", \"삭\", \"▼\", \"大\", \"죽\", \"堂\", \"→\", \"쓸\", \"제\", \"택\", \"理\", \"븐\", \"질\", \"팔\", \"확\", \"🏻\", \"요\", \"流\", \"직\", \"턴\", \"뺑\", \"깝\", \"題\", \"울\", \"핑\", \"앗\", \"곰\", \"껴\", \"적\", \"놨\", \"淘\", \"여\", \"◎\", \"엠\", \"蒙\", \"맷\", \"謝\", \"才\", \"歲\", \"퍼\", \"適\", \"%\", \"換\", \"色\", \"피\", \"ɪ\", \"커\", \"|\", \"땠\", \"끓\", \"꿇\", \"💅\", \"헉\", \"깐\", \"陳\", \"會\", \"웅\", \"◀\", \"拮\", \"헤\", \"땀\", \"앓\", \"맹\", \"脱\", \"子\", \"立\", \"띄\", \"닮\", \"춥\", \"ㅢ\", \"깊\", \"세\", \"일\", \"뿌\", \"됬\", \"璣\", \"룬\", \"실\", \"귀\", \"米\", \"被\", \"鎭\", \"툭\", \"면\", \"촉\", \"층\", \"ᴡ\", \"믄\", \"샀\", \"찼\", \"폐\", \"못\", \"낫\", \"쵸\", \"봬\", \"닳\", \"『\", \"天\", \"徳\", \"였\", \"龍\", \"멍\", \"헬\", \"故\", \"野\", \"팁\", \"퀸\", \"딩\", \"멈\", \"拘\", \"そ\", \"낸\", \"◐\", \"톰\", \"봄\", \"쌩\", \"더\", \"💦\", \"手\", \"몫\", \"윙\", \"志\", \"ᴏ\", \"無\", \"튼\", \"쭉\", \"넷\", \"獨\", \"뿜\", \"튀\", \"쭈\", \"Ⅵ\", \"맘\", \"벅\", \"읍\", \"맥\", \"탁\", \"地\", \"武\", \"行\", \"얽\", \"➏\", \"소\", \"떻\", \"두\", \"렉\", \"봇\", \"잤\", \"韜\", \"탕\", \"홑\", \"히\", \"정\", \"늑\", \"걱\", \"쿤\", \"를\", \"닦\", \"썅\", \"쿨\", \"페\", \"헛\", \"살\", \"녘\", \"헐\", \"즈\", \"삼\", \"느\", \"톱\", \"됨\", \"析\", \"릭\", \"괌\", \"像\", \"💣\", \"주\", \"뢰\", \"뇌\", \"블\", \"㏊\", \"검\", \"돔\", \"률\", \"달\", \"흥\", \"ㆍ\", \"칭\", \"멘\", \"🤟\", \"건\", \"ㅅ\", \"🌵\", \"칼\", \"황\", \"ⓔ\", \"긍\", \"끗\", \"☆\", \"버\", \"쏙\", \"쐬\", \"標\", \"앙\", \"毛\", \"댓\", \"흐\", \"掌\", \"끔\", \"樂\", \"ㅣ\", \"☎\", \"뀌\", \"쉽\", \"룸\", \"짢\", \"紙\", \"재\", \"웬\", \"德\", \"륨\", \"群\", \"럿\", \"夜\", \"肉\", \"蟄\", \"등\", \"샵\", \"貿\", \"팩\", \"ㅘ\", \"第\", \"福\", \"변\", \"넬\", \"탄\", \"발\", \"善\", \"🍟\", \"촌\", \"벤\", \"있\", \"썼\", \"商\", \"흘\", \"春\", \"랜\", \"諒\", \"줏\", \"딥\", \"界\", \"😭\", \"耕\", \"조\", \"잔\", \"볍\", \"林\", \"❤\", \"엔\", \"흰\", \"比\", \"👏\", \"뎅\", \":\", \"육\", \"혹\", \"흡\", \"뤼\", \"寛\", \"꽤\", \"쌈\", \"룰\", \"㎡\", \"숏\", \"셸\", \"캐\", \"춰\", \"쭙\", \"꽝\", \"녹\", \"詠\", \"쏜\", \"◾\", \"후\", \"삣\", \"몬\", \"▲\", \"人\", \"튄\", \"텝\", \"깅\", \"징\", \"널\", \"틴\", \"쑥\", \"혜\", \"것\", \"現\", \"옮\", \"킹\", \"싼\", \"俗\", \"§\", \"明\", \"권\", \"틀\", \"抗\", \"인\", \"슴\", \"種\", \"렛\", \"툰\", \"뼈\", \"科\", \"펜\", \"믹\", \"샐\", \"찍\", \"앞\", \"靑\", \"✈\", \"순\", \"🙇\", \"할\", \"뛸\", \"쉰\", \"챔\", \"렀\", \"젖\", \"雙\", \"딘\", \"깡\", \"킬\", \"榜\", \"尤\", \"벙\", \"으\", \"옴\", \"찾\", \"包\", \"월\", \"싸\", \"쪽\", \"픕\", \"有\", \"몹\", \"날\", \"키\", \"立\", \"엄\", \"엌\", \"⑧\", \"탱\", \"뮌\", \"계\", \"칸\", \"닥\", \"따\", \"렵\", \"삶\", \"紀\", \"챨\", \"祐\", \"至\", \"슈\", \"〕\", \"峴\", \"냠\", \"協\", \"욜\", \"뇨\", \"⑦\", \"밖\", \"北\", \"犬\", \"樺\", \"델\", \"〔\", \"흙\", \"떨\", \"뺏\", \"점\", \"의\", \"반\", \"相\", \"통\", \"윤\", \"變\", \"터\", \"液\", \"臺\", \"部\", \"녀\", \"㎍\", \"쌓\", \"약\", \"↕\", \"넵\", \"젊\", \"오\", \"申\", \"薄\", \"農\", \"줄\", \"필\", \"‧\", \"藝\", \"잉\", \"도\", \"총\", \"쩍\", \"陸\", \"가\", \"졌\", \"형\", \"욕\", \"뚝\", \"ⅰ\", \"꽃\", \"돕\", \"〉\", \"쥬\", \"과\", \"넹\", \"착\", \"▣\", \"년\", \"甲\", \"梁\", \"🙌\", \"탠\", \"윗\", \"‬\", \"弊\", \"鮮\", \"팹\", \"논\", \"르\", \"숯\", \"닿\", \"쉬\", \"川\", \"ń\", \"外\", \"훈\", \"邦\", \"※\", \"방\", \"잃\", \"접\", \"Ⅷ\", \"혁\", \"쌉\", \"캇\", \"태\", \"론\", \"皮\", \"벵\", \"맺\", \"朱\", \"갔\", \"럴\", \"論\", \"東\", \"값\", \"옵\", \"편\", \"뼘\", \"ㅐ\", \"진\", \"흔\", \"켄\", \"α\", \"겼\", \"乃\", \"汰\", \"효\", \"침\", \"쾌\", \"뮈\", \"쏘\", \"젝\", \"잰\", \"뮤\", \"🍔\", \"똘\", \"갛\", \"衣\", \"雄\", \"텨\", \"엿\", \"南\", \"쫗\", \"템\", \"@\", \"힜\", \"愛\", \"핫\", \"솔\", \"젓\", \"엘\", \"書\", \"떠\", \"★\", \"↑\", \"投\", \"절\", \"츄\", \"농\", \"冬\", \"딸\", \"옳\", \"팰\", \"볼\", \"너\", \"흄\", \"귤\", \"놔\", \"Ⅶ\", \"낯\", \"🌿\", \"仲\", \"던\", \"캡\", \"🤭\", \"부\", \"출\", \"얼\", \"럽\", \"픽\", \"팜\", \"칠\", \"딧\", \"웠\", \"멋\", \"▷\", \"켤\", \"넘\", \"⚀\", \"핀\", \"펄\", \"찌\", \"쳤\", \"ⓒ\", \"氣\", \"數\", \"뷔\", \"팠\", \"랴\", \"심\", \"亭\", \"올\", \"쨍\", \"쓕\", \"⇒\", \"솨\", \"종\", \"驚\", \"붓\", \"알\", \"핥\", \"ㅡ\", \"衛\", \"메\", \"극\", \"걔\", \"료\", \"飮\", \"壞\", \"祉\", \"먹\", \"돋\", \"타\", \"렷\", \"골\", \"짜\", \"쏠\", \"랑\", \"넥\", \"곤\", \"뭥\", \"떴\", \"독\", \"◑\", \"▒\", \"≫\", \"뜨\", \"선\", \"듈\", \"璿\", \"쟁\", \"蚩\", \"될\", \"樂\", \"굵\", \"닝\", \"띕\", \"述\", \"붕\", \"틔\", \"걀\", \"金\", \"誡\", \"엉\", \"瀧\", \"合\", \"曆\", \"🙋\", \"不\", \"鐘\", \"큐\", \"떼\", \"❍\", \"ㅗ\", \"철\", \"맬\", \"늙\", \"싯\", \"국\", \"렁\", \"略\", \"⑹\", \"밥\", \"망\", \"草\", \"석\", \"뉴\", \"眞\", \"율\", \"贖\", \"英\", \"둘\", \"나\", \"봉\", \"링\", \"乙\", \"산\", \"Ⅱ\", \"쳐\", \"趺\", \"쟈\", \"량\", \"텁\", \"選\", \"엽\", \"㎞\", \"규\", \"🚿\", \"사\", \"可\", \"깃\", \"밭\", \"靈\", \"居\", \"코\", \"弛\", \"쫄\", \"火\", \"차\", \"웹\", \"분\", \"뚫\", \"매\", \"쿄\", \"댐\", \"神\", \"개\", \"욥\", \"줌\", \"改\", \"닛\", \"🍎\", \"Ⅸ\", \"킌\", \"줍\", \"命\", \"◇\", \"峙\", \"🍰\", \"노\", \"와\", \"龍\", \"쓴\", \"렇\", \"初\", \"즌\", \"팬\", \"🚨\", \"셉\", \"돗\", \"係\", \"先\", \"술\", \"내\", \"🍭\", \"始\", \"v\", \"↔\", \"었\", \"죠\", \"짤\", \"끈\", \"얹\", \"장\", \"스\", \"롭\", \"七\", \"촛\", \"😂\", \"털\", \"풍\", \"칙\", \"◈\", \"쩡\", \"녔\", \"窮\", \"넌\", \"훨\", \"꼬\", \"답\", \"벽\", \"ⅱ\", \"멀\", \"쪼\", \"몰\", \"모\", \"놈\", \"폈\", \"㉣\", \"천\", \"갓\", \"섦\", \"물\", \"찢\", \"잠\", \"敬\", \"콜\", \"험\", \"령\", \"륙\", \"際\", \"셌\", \"回\", \"‍\", \"겉\", \"눠\", \"빙\", \"朝\", \"셜\", \"십\", \"技\", \"킷\", \"떡\", \"추\", \"츠\", \"用\", \"외\", \"푸\", \"⊙\", \"›\", \"×\", \"갉\", \"하\", \"덕\", \"폴\", \"띤\", \"누\", \"上\", \"門\", \"😣\", \"컬\", \"금\", \"낼\", \"籍\", \"王\", \"덧\", \"●\", \"괴\", \"밉\", \"뽑\", \"目\", \"死\", \"©\", \"헌\", \"뱀\", \"깔\", \"章\", \"색\", \"方\", \"μ\", \"짐\", \"♪\", \"잭\", \"걸\", \"쇠\", \"쿡\", \"次\", \"숨\", \"俠\", \"읊\", \"낙\", \"說\", \"슐\", \"亨\", \"綃\", \"中\", \"🌳\", \"結\", \"토\", \"長\", \"엣\", \"압\", \"첩\", \"꼽\", \"짊\", \"體\", \"山\", \"擒\", \"벌\", \"ʏ\", \"ㅏ\", \"닌\", \"뒤\", \"충\", \"펙\", \"雪\", \"뜻\", \"安\", \"︎\", \"퍽\", \"Ⅴ\", \"강\", \"쒀\", \"쿰\", \"生\", \"高\", \"늄\", \"族\", \"지\", \"봐\", \"솟\", \"原\", \"굴\", \"굳\", \"뻤\", \"⑤\", \"콤\", \"胡\", \"급\", \"뱉\", \"濁\", \"콥\", \"왠\", \"쇄\", \"≪\", \"봅\", \"단\", \"랐\", \"텀\", \"펠\", \"쯔\", \"화\", \"벼\", \"축\", \"良\", \"륵\", \"혈\", \"里\", \"째\", \"핍\", \"폍\", \"뻐\", \"∼\", \"\", \"뜸\", \"뫼\", \"벗\", \"겔\", \"뿐\", \"훅\", \"ⅳ\", \"꼈\", \"否\", \"람\", \"판\", \"견\", \"칩\", \"勢\", \"字\", \"😱\", \"反\", \"프\", \"퀀\", \"巡\", \"臀\", \"복\", \"겪\", \"잖\", \"운\", \"․\", \"궐\", \"집\", \"弟\", \"젤\", \"놀\", \"‥\", \"잡\", \" \", \"뺀\", \"존\", \"랙\", \"냈\", \"묵\", \"얀\", \"系\", \"빳\", \"숟\", \"흗\", \"슷\", \"니\", \"社\", \"웃\", \"립\", \"뀐\", \"離\", \"샘\", \"녁\", \"엑\", \"컸\", \"긴\", \"왔\", \"획\", \"밴\", \"㈜\", \"‎\", \"¹\", \"빗\", \"角\", \"붙\", \"튠\", \"뱅\", \"멸\", \"ㄹ\", \"劫\", \"덜\", \"⑶\", \"써\", \"삐\", \"乳\", \"잼\", \"덟\", \"뭉\", \"팍\", \"자\", \"탬\", \"♤\", \"皇\", \"ㅛ\", \"飾\", \"應\", \"닉\", \"체\", \"틸\", \"서\", \"슛\", \"킴\", \"우\", \"글\", \"되\", \"짓\", \"맛\", \"담\", \"웍\", \"셰\", \"꾀\", \"썬\", \"학\", \"씽\", \"食\", \"랫\", \"빡\", \"一\", \"냅\", \"ʟ\", \"業\", \"갇\", \"덤\", \"펴\", \"京\", \"둑\", \"」\", \"特\", \"엮\", \"입\", \"퀴\", \"팽\", \"챙\", \"し\", \"頭\", \"밑\", \"왓\", \"씻\", \"ㅋ\", \"拜\", \"넛\", \"퉁\", \"썩\", \"八\", \"쑤\", \"🏷\", \"책\", \"엎\", \"ㄴ\", \"늬\", \"신\", \"볶\", \"머\", \"껀\", \"ㅝ\", \"쿼\", \"영\", \"빨\", \"얄\", \"톡\"]", + "lossless": false + }, + "microsoft/Phi-3-mini-4k-instruct @ cc100/ar": { + "tokenizer": "Phi-3-mini-4k-instruct", + "organization": "Microsoft", + "vocab_size": 32011, + "_n_bytes": 2813283, + "_n_tokens": 1422081, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "microsoft/Phi-3-mini-4k-instruct @ cc100/de": { + "tokenizer": "Phi-3-mini-4k-instruct", + "organization": "Microsoft", + "vocab_size": 32011, + "_n_bytes": 1814876, + "_n_tokens": 527320, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "microsoft/Phi-3-mini-4k-instruct @ cc100/fa": { + "tokenizer": "Phi-3-mini-4k-instruct", + "organization": "Microsoft", + "vocab_size": 32011, + "_n_bytes": 2054052, + "_n_tokens": 1145076, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "microsoft/Phi-3-mini-4k-instruct @ cc100/ja": { + "tokenizer": "Phi-3-mini-4k-instruct", + "organization": "Microsoft", + "vocab_size": 32011, + "_n_bytes": 1774770, + "_n_tokens": 718461, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "microsoft/Phi-3-mini-4k-instruct @ cc100/ko": { + "tokenizer": "Phi-3-mini-4k-instruct", + "organization": "Microsoft", + "vocab_size": 32011, + "_n_bytes": 1524839, + "_n_tokens": 954428, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "microsoft/phi-1 @ cc100/ar": { + "tokenizer": "phi-1", + "organization": "Microsoft", + "vocab_size": 50295, + "_n_bytes": 2813283, + "_n_tokens": 1558111, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "microsoft/phi-1 @ cc100/de": { + "tokenizer": "phi-1", + "organization": "Microsoft", + "vocab_size": 50295, + "_n_bytes": 1814876, + "_n_tokens": 684665, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "microsoft/phi-1 @ cc100/fa": { + "tokenizer": "phi-1", + "organization": "Microsoft", + "vocab_size": 50295, + "_n_bytes": 2054052, + "_n_tokens": 1292300, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "microsoft/phi-1 @ cc100/ja": { + "tokenizer": "phi-1", + "organization": "Microsoft", + "vocab_size": 50295, + "_n_bytes": 1774770, + "_n_tokens": 844362, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "microsoft/phi-1 @ cc100/ko": { + "tokenizer": "phi-1", + "organization": "Microsoft", + "vocab_size": 50295, + "_n_bytes": 1524839, + "_n_tokens": 1308988, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "microsoft/phi-2 @ cc100/ar": { + "tokenizer": "phi-2", + "organization": "Microsoft", + "vocab_size": 50295, + "_n_bytes": 2813283, + "_n_tokens": 1558111, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "microsoft/phi-2 @ cc100/de": { + "tokenizer": "phi-2", + "organization": "Microsoft", + "vocab_size": 50295, + "_n_bytes": 1814876, + "_n_tokens": 684665, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "microsoft/phi-2 @ cc100/fa": { + "tokenizer": "phi-2", + "organization": "Microsoft", + "vocab_size": 50295, + "_n_bytes": 2054052, + "_n_tokens": 1292300, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "microsoft/phi-2 @ cc100/ja": { + "tokenizer": "phi-2", + "organization": "Microsoft", + "vocab_size": 50295, + "_n_bytes": 1774770, + "_n_tokens": 844362, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "microsoft/phi-2 @ cc100/ko": { + "tokenizer": "phi-2", + "organization": "Microsoft", + "vocab_size": 50295, + "_n_bytes": 1524839, + "_n_tokens": 1308988, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "mistralai/Mistral-7B-v0.1 @ cc100/ar": { + "tokenizer": "Mistral-7B-v0.1", + "organization": "Mistral", + "vocab_size": 32000, + "_n_bytes": 2813283, + "_n_tokens": 1396319, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "mistralai/Mistral-7B-v0.1 @ cc100/de": { + "tokenizer": "Mistral-7B-v0.1", + "organization": "Mistral", + "vocab_size": 32000, + "_n_bytes": 1814876, + "_n_tokens": 567526, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "mistralai/Mistral-7B-v0.1 @ cc100/fa": { + "tokenizer": "Mistral-7B-v0.1", + "organization": "Mistral", + "vocab_size": 32000, + "_n_bytes": 2054052, + "_n_tokens": 1123278, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "mistralai/Mistral-7B-v0.1 @ cc100/ja": { + "tokenizer": "Mistral-7B-v0.1", + "organization": "Mistral", + "vocab_size": 32000, + "_n_bytes": 1774770, + "_n_tokens": 675134, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "mistralai/Mistral-7B-v0.1 @ cc100/ko": { + "tokenizer": "Mistral-7B-v0.1", + "organization": "Mistral", + "vocab_size": 32000, + "_n_bytes": 1524839, + "_n_tokens": 718766, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "mistralai/Mixtral-8x7B-v0.1 @ cc100/ar": { + "tokenizer": "Mixtral-8x7B-v0.1", + "organization": "Mistral", + "vocab_size": 32000, + "_n_bytes": 2813283, + "_n_tokens": 1396319, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "mistralai/Mixtral-8x7B-v0.1 @ cc100/de": { + "tokenizer": "Mixtral-8x7B-v0.1", + "organization": "Mistral", + "vocab_size": 32000, + "_n_bytes": 1814876, + "_n_tokens": 567526, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "mistralai/Mixtral-8x7B-v0.1 @ cc100/fa": { + "tokenizer": "Mixtral-8x7B-v0.1", + "organization": "Mistral", + "vocab_size": 32000, + "_n_bytes": 2054052, + "_n_tokens": 1123278, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "mistralai/Mixtral-8x7B-v0.1 @ cc100/ja": { + "tokenizer": "Mixtral-8x7B-v0.1", + "organization": "Mistral", + "vocab_size": 32000, + "_n_bytes": 1774770, + "_n_tokens": 675134, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "mistralai/Mixtral-8x7B-v0.1 @ cc100/ko": { + "tokenizer": "Mixtral-8x7B-v0.1", + "organization": "Mistral", + "vocab_size": 32000, + "_n_bytes": 1524839, + "_n_tokens": 718766, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai-community/gpt2 @ cc100/ar": { + "tokenizer": "gpt2", + "organization": "OpenAI", + "vocab_size": 50257, + "_n_bytes": 2813283, + "_n_tokens": 1558111, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "openai-community/gpt2 @ cc100/de": { + "tokenizer": "gpt2", + "organization": "OpenAI", + "vocab_size": 50257, + "_n_bytes": 1814876, + "_n_tokens": 684669, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "openai-community/gpt2 @ cc100/fa": { + "tokenizer": "gpt2", + "organization": "OpenAI", + "vocab_size": 50257, + "_n_bytes": 2054052, + "_n_tokens": 1292300, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "openai-community/gpt2 @ cc100/ja": { + "tokenizer": "gpt2", + "organization": "OpenAI", + "vocab_size": 50257, + "_n_bytes": 1774770, + "_n_tokens": 844362, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "openai-community/gpt2 @ cc100/ko": { + "tokenizer": "gpt2", + "organization": "OpenAI", + "vocab_size": 50257, + "_n_bytes": 1524839, + "_n_tokens": 1309029, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "openai/code-davinci-002 @ cc100/ar": { + "tokenizer": "code-davinci-002", + "organization": "OpenAI", + "vocab_size": 50281, + "_n_bytes": 2813283, + "_n_tokens": 1558111, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/code-davinci-002 @ cc100/de": { + "tokenizer": "code-davinci-002", + "organization": "OpenAI", + "vocab_size": 50281, + "_n_bytes": 1814876, + "_n_tokens": 684666, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/code-davinci-002 @ cc100/fa": { + "tokenizer": "code-davinci-002", + "organization": "OpenAI", + "vocab_size": 50281, + "_n_bytes": 2054052, + "_n_tokens": 1292300, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/code-davinci-002 @ cc100/ja": { + "tokenizer": "code-davinci-002", + "organization": "OpenAI", + "vocab_size": 50281, + "_n_bytes": 1774770, + "_n_tokens": 844362, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/code-davinci-002 @ cc100/ko": { + "tokenizer": "code-davinci-002", + "organization": "OpenAI", + "vocab_size": 50281, + "_n_bytes": 1524839, + "_n_tokens": 1308993, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-3.5-turbo @ cc100/ar": { + "tokenizer": "gpt-3.5-turbo", + "organization": "OpenAI", + "vocab_size": 100277, + "_n_bytes": 2813283, + "_n_tokens": 1105640, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-3.5-turbo @ cc100/de": { + "tokenizer": "gpt-3.5-turbo", + "organization": "OpenAI", + "vocab_size": 100277, + "_n_bytes": 1814876, + "_n_tokens": 500870, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-3.5-turbo @ cc100/fa": { + "tokenizer": "gpt-3.5-turbo", + "organization": "OpenAI", + "vocab_size": 100277, + "_n_bytes": 2054052, + "_n_tokens": 818067, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-3.5-turbo @ cc100/ja": { + "tokenizer": "gpt-3.5-turbo", + "organization": "OpenAI", + "vocab_size": 100277, + "_n_bytes": 1774770, + "_n_tokens": 630348, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-3.5-turbo @ cc100/ko": { + "tokenizer": "gpt-3.5-turbo", + "organization": "OpenAI", + "vocab_size": 100277, + "_n_bytes": 1524839, + "_n_tokens": 652277, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-4 @ cc100/ar": { + "tokenizer": "gpt-4", + "organization": "OpenAI", + "vocab_size": 100277, + "_n_bytes": 2813283, + "_n_tokens": 1105640, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-4 @ cc100/de": { + "tokenizer": "gpt-4", + "organization": "OpenAI", + "vocab_size": 100277, + "_n_bytes": 1814876, + "_n_tokens": 500870, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-4 @ cc100/fa": { + "tokenizer": "gpt-4", + "organization": "OpenAI", + "vocab_size": 100277, + "_n_bytes": 2054052, + "_n_tokens": 818067, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-4 @ cc100/ja": { + "tokenizer": "gpt-4", + "organization": "OpenAI", + "vocab_size": 100277, + "_n_bytes": 1774770, + "_n_tokens": 630348, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-4 @ cc100/ko": { + "tokenizer": "gpt-4", + "organization": "OpenAI", + "vocab_size": 100277, + "_n_bytes": 1524839, + "_n_tokens": 652277, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-4o @ cc100/ar": { + "tokenizer": "gpt-4o", + "organization": "OpenAI", + "vocab_size": 200019, + "_n_bytes": 2813283, + "_n_tokens": 514909, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-4o @ cc100/de": { + "tokenizer": "gpt-4o", + "organization": "OpenAI", + "vocab_size": 200019, + "_n_bytes": 1814876, + "_n_tokens": 412599, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-4o @ cc100/fa": { + "tokenizer": "gpt-4o", + "organization": "OpenAI", + "vocab_size": 200019, + "_n_bytes": 2054052, + "_n_tokens": 379156, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-4o @ cc100/ja": { + "tokenizer": "gpt-4o", + "organization": "OpenAI", + "vocab_size": 200019, + "_n_bytes": 1774770, + "_n_tokens": 452794, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/gpt-4o @ cc100/ko": { + "tokenizer": "gpt-4o", + "organization": "OpenAI", + "vocab_size": 200019, + "_n_bytes": 1524839, + "_n_tokens": 405624, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/text-davinci-003 @ cc100/ar": { + "tokenizer": "text-davinci-003", + "organization": "OpenAI", + "vocab_size": 50281, + "_n_bytes": 2813283, + "_n_tokens": 1558111, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/text-davinci-003 @ cc100/de": { + "tokenizer": "text-davinci-003", + "organization": "OpenAI", + "vocab_size": 50281, + "_n_bytes": 1814876, + "_n_tokens": 684666, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/text-davinci-003 @ cc100/fa": { + "tokenizer": "text-davinci-003", + "organization": "OpenAI", + "vocab_size": 50281, + "_n_bytes": 2054052, + "_n_tokens": 1292300, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/text-davinci-003 @ cc100/ja": { + "tokenizer": "text-davinci-003", + "organization": "OpenAI", + "vocab_size": 50281, + "_n_bytes": 1774770, + "_n_tokens": 844362, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "openai/text-davinci-003 @ cc100/ko": { + "tokenizer": "text-davinci-003", + "organization": "OpenAI", + "vocab_size": 50281, + "_n_bytes": 1524839, + "_n_tokens": 1308993, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": true + }, + "paust/pko-t5-large @ cc100/ar": { + "tokenizer": "pko-t5-large", + "organization": "PAUST", + "vocab_size": 50358, + "_n_bytes": 2813283, + "_n_tokens": 2805586, + "_n_chars": 1560987, + "_n_oov_chars": 202, + "oov_ratio": 0.00012940530574565964, + "_oov_charset": "[\"ﷺ\", \"…\", \"ﻷ\", \"½\", \"ﻻ\", \"ﻹ\", \"″\"]", + "lossless": false + }, + "paust/pko-t5-large @ cc100/de": { + "tokenizer": "pko-t5-large", + "organization": "PAUST", + "vocab_size": 50358, + "_n_bytes": 1814876, + "_n_tokens": 1244350, + "_n_chars": 1784021, + "_n_oov_chars": 457, + "oov_ratio": 0.0002561629039120055, + "_oov_charset": "[\"…\", \"¹\", \"½\", \" \", \"™\", \"¼\", \"´\", \"²\"]", + "lossless": false + }, + "paust/pko-t5-large @ cc100/fa": { + "tokenizer": "pko-t5-large", + "organization": "PAUST", + "vocab_size": 50358, + "_n_bytes": 2054052, + "_n_tokens": 2051040, + "_n_chars": 1145876, + "_n_oov_chars": 605, + "oov_ratio": 0.0005279803399320694, + "_oov_charset": "[\"…\", \"ﮧ\"]", + "lossless": false + }, + "paust/pko-t5-large @ cc100/ja": { + "tokenizer": "pko-t5-large", + "organization": "PAUST", + "vocab_size": 50358, + "_n_bytes": 1774770, + "_n_tokens": 1756950, + "_n_chars": 603065, + "_n_oov_chars": 6917, + "oov_ratio": 0.011469742067604653, + "_oov_charset": "[\"コ\", \"゙\", \"k\", \"i\", \"s\", \"テ\", \"ノ\", \"^\", \"r\", \"l\", \"‥\", \"`\", \" \", \"ヘ\", \"″\", \"メ\", \"+\", \";\", \"…\", \"ハ\", \"~\", \"y\", \"カ\", \"8\", \"A\", \"f\", \"ロ\", \">\", \"M\", \"3\", \"B\", \"9\", \"・\", \"?\", \"⑩\", \"Z\", \"「\", \")\", \"/\", \"(\", \"D\", \"ア\", \"①\", \"Y\", \"ヨ\", \"2\", \"Ⅹ\", \"%\", \"&\", \"U\", \"④\", \"N\", \"Q\", \"|\", \"t\", \"ー\", \"\\", \"フ\", \"6\", \"」\", \"d\", \"b\", \"ゥ\", \"4\", \"J\", \"-\", \"‼\", \"m\", \"]\", \"o\", \".\", \"!\", \"e\", \"<\", \"ィ\", \"K\", \"V\", \"0\", \"I\", \"@\", \"S\", \"⑧\", \"リ\", \"T\", \"¥\", \"$\", \"℃\", \"g\", \" ̄\", \"⑪\", \"X\", \"a\", \"=\", \"H\", \"1\", \"E\", \"P\", \"゚\", \"7\", \"´\", \"Ⅶ\", \"レ\", \"w\", \"*\", \"_\", \"ウ\", \"R\", \",\", \"ㅂ\", \"F\", \"5\", \"[\", \"n\", \"Ⅱ\", \"W\", \"③\", \"O\", \"、\", \"㎞\", \"L\", \"G\", \"C\", \"②\", \"。\", \"h\", \":\"]", + "lossless": false + }, + "paust/pko-t5-large @ cc100/ko": { + "tokenizer": "pko-t5-large", + "organization": "PAUST", + "vocab_size": 50358, + "_n_bytes": 1524839, + "_n_tokens": 461643, + "_n_chars": 655190, + "_n_oov_chars": 1311, + "oov_ratio": 0.0020009462903890474, + "_oov_charset": "[\"靈\", \"ⓒ\", \"․\", \"s\", \"陸\", \"㎡\", \"‥\", \"ⅰ\", \"ㄷ\", \"Ⅵ\", \" \", \"識\", \"…\", \"Ⅸ\", \"Ⅳ\", \"ㅙ\", \"梁\", \"Ⅲ\", \"龍\", \"ㅡ\", \"流\", \"?\", \"ㅑ\", \"ㅜ\", \"「\", \"ㅎ\", \"ㅓ\", \"ㅞ\", \"ㅍ\", \"Ⅷ\", \"㈜\", \"v\", \"¹\", \"①\", \"㏊\", \"Ⅹ\", \"%\", \"²\", \"Ⅰ\", \"ㄹ\", \"ㅏ\", \"④\", \"ㅒ\", \"⑶\", \"|\", \"ㅁ\", \"ㆍ\", \"ㅔ\", \"」\", \"ㅐ\", \"ㅅ\", \"Ⅴ\", \"ⓔ\", \"ㅛ\", \"ㅠ\", \"樂\", \"ⅱ\", \"⑤\", \"㉣\", \"ㅚ\", \"女\", \"ㅕ\", \"樂\", \"ㅣ\", \"ㅢ\", \"不\", \"立\", \"@\", \"㎥\", \"⑥\", \"⑧\", \"ⅲ\", \"℃\", \"理\", \"ㅖ\", \"良\", \"ㅗ\", \"⑸\", \"ㅘ\", \"㉠\", \"ㄱ\", \"⑹\", \"⑦\", \"⁴\", \"Ⅶ\", \"ㅋ\", \"ㅟ\", \"*\", \"金\", \"ㅆ\", \"⑴\", \"ⅳ\", \"ㅇ\", \"Ⅱ\", \"③\", \"㉰\", \"ㅊ\", \"⑨\", \"⑵\", \"ㄴ\", \"㎞\", \"㎍\", \"累\", \"②\", \"ㅝ\", \":\", \"ㅈ\"]", + "lossless": false + }, + "rinna/bilingual-gpt-neox-4b @ cc100/ar": { + "tokenizer": "bilingual-gpt-neox-4b", + "organization": "ABEJA", + "vocab_size": 65536, + "_n_bytes": 2813283, + "_n_tokens": 1327285, + "_n_chars": 1560987, + "_n_oov_chars": 1201, + "oov_ratio": 0.0007693850108937486, + "_oov_charset": "[\"ۚ\", \"ﻷ\", \"½\", \"٦\", \"۸\", \"٪\", \"ۗ\", \"١\", \"﴾\", \"↩\", \"▫\", \"▪\", \"😀\", \"ۤ\", \"٨\", \"٧\", \"‎\", \"
\", \"ﻻ\", \"ٰ\", \"ﻹ\", \"″\", \"٣\", \"۲\", \"🙂\", \"٩\", \"ﷺ\", \"…\", \"٤\", \"٠\", \"٥\", \"۷\", \"‬\", \"😊\", \"٢\", \"ٌ\", \"؛\", \"​\", \"﴿\", \"ۖ\", \"⤴\", \"۰\"]", + "lossless": false + }, + "rinna/bilingual-gpt-neox-4b @ cc100/de": { + "tokenizer": "bilingual-gpt-neox-4b", + "organization": "ABEJA", + "vocab_size": 65536, + "_n_bytes": 1814876, + "_n_tokens": 969590, + "_n_chars": 1784021, + "_n_oov_chars": 717, + "oov_ratio": 0.00040190109869782923, + "_oov_charset": "[\"½\", \" \", \"↩\", \"\", \"™\", \"😀\", \"´\", \"“\", \"😦\", \"‽\", \"‎\", \"¹\", \"➔\", \"😈\", \"­\", \"😆\", \"😉\", \"²\", \"🙂\", \"…\", \"Ÿ\", \"🙁\", \"😂\", \"–\", \"„\", \"☺\", \"😢\", \"​\", \"😃\", \"🙄\", \"¼\"]", + "lossless": false + }, + "rinna/bilingual-gpt-neox-4b @ cc100/fa": { + "tokenizer": "bilingual-gpt-neox-4b", + "organization": "ABEJA", + "vocab_size": 65536, + "_n_bytes": 2054052, + "_n_tokens": 986503, + "_n_chars": 1145876, + "_n_oov_chars": 4682, + "oov_ratio": 0.004085956944730494, + "_oov_charset": "[\"‍\", \"۸\", \"٪\", \"ﮧ\", \"١\", \"۳\", \"٫\", \" \", \"٨\", \"٧\", \"۴\", \"‎\", \"ٴ\", \"۹\", \"ڪ\", \"٣\", \"۲\", \"­\", \"۵\", \"٩\", \"…\", \"۶\", \"▐\", \"ٔ\", \"✿\", \"۔\", \"◄\", \"٤\", \"٠\", \"٥\", \"۷\", \"٢\", \"ٌ\", \"؛\", \"​\", \"۰\", \"ۀ\"]", + "lossless": false + }, + "rinna/bilingual-gpt-neox-4b @ cc100/ja": { + "tokenizer": "bilingual-gpt-neox-4b", + "organization": "ABEJA", + "vocab_size": 65536, + "_n_bytes": 1774770, + "_n_tokens": 300366, + "_n_chars": 603065, + "_n_oov_chars": 6952, + "oov_ratio": 0.01152777892930281, + "_oov_charset": "[\"コ\", \"゙\", \"k\", \"i\", \"s\", \"テ\", \"ノ\", \"^\", \" \", \"r\", \"l\", \"‥\", \"`\", \" \", \"ヘ\", \"″\", \"メ\", \"+\", \";\", \"…\", \"ハ\", \"~\", \"y\", \"カ\", \"8\", \"A\", \"f\", \"✧\", \"ロ\", \">\", \"M\", \"3\", \"B\", \"9\", \"・\", \"?\", \"⑩\", \"Z\", \"◡\", \"「\", \")\", \"/\", \"(\", \"D\", \"\\u001b\", \"丿\", \"ア\", \"①\", \"Y\", \"ヨ\", \"2\", \"Ⅹ\", \"%\", \"&\", \"U\", \"④\", \"N\", \"\\b\", \"Q\", \"|\", \"t\", \"ー\", \"\\", \"フ\", \"6\", \"\", \"」\", \"⻑\", \"d\", \"b\", \"ゥ\", \"4\", \"J\", \"-\", \"‼\", \"m\", \"]\", \"o\", \".\", \"!\", \"e\", \"<\", \"ィ\", \"K\", \"⌒\", \"V\", \"0\", \"I\", \"@\", \"S\", \"ヾ\", \"⑧\", \"リ\", \"😊\", \"T\", \"¥\", \"$\", \"℃\", \"✨\", \"g\", \" ̄\", \"😌\", \"⑪\", \"噤\", \"X\", \"a\", \"=\", \"H\", \"1\", \"E\", \"\", \"P\", \"゚\", \"7\", \"´\", \"๑\", \"Ⅶ\", \"レ\", \"w\", \"*\", \"_\", \"ウ\", \"R\", \"😭\", \",\", \"ㅂ\", \"F\", \"5\", \"[\", \"n\", \"Ⅱ\", \"W\", \"③\", \"O\", \"、\", \"㎞\", \"L\", \"G\", \"C\", \"▷\", \"😢\", \"②\", \"。\", \"💦\", \"​\", \"h\", \"🌙\", \":\", \"♫\"]", + "lossless": false + }, + "rinna/bilingual-gpt-neox-4b @ cc100/ko": { + "tokenizer": "bilingual-gpt-neox-4b", + "organization": "ABEJA", + "vocab_size": 65536, + "_n_bytes": 1524839, + "_n_tokens": 641274, + "_n_chars": 655190, + "_n_oov_chars": 39698, + "oov_ratio": 0.06059005784581572, + "_oov_charset": "[\"윈\", \"싣\", \"칵\", \"섯\", \"🥁\", \"펌\", \"싶\", \"퀘\", \"뭇\", \"묘\", \"폭\", \"훔\", \"츈\", \"😗\", \"ㅙ\", \"Ⅲ\", \"잣\", \"붉\", \"훑\", \"액\", \"껍\", \"샴\", \"맙\", \"빵\", \"힐\", \"쫀\", \"푹\", \"꺽\", \"얻\", \"Ⅹ\", \"믐\", \"쁨\", \"궤\", \"햇\", \"숲\", \"밋\", \"ㅁ\", \"뵙\", \"돼\", \"쥔\", \"넨\", \"듭\", \"륜\", \"룹\", \"댈\", \"ㅕ\", \"힘\", \"핏\", \"겁\", \"딜\", \"🍞\", \"깥\", \"ᴄ\", \"앨\", \"푼\", \"툼\", \"콩\", \"왼\", \"뗀\", \"낮\", \"ㄱ\", \"⁴\", \"눔\", \"金\", \"◦\", \"­\", \"넓\", \"☞\", \"쬐\", \"ㅇ\", \"득\", \"덥\", \"쩌\", \"㉰\", \"벚\", \"쪄\", \"얍\", \"켓\", \"닫\", \"💸\", \"톤\", \"혀\", \"卽\", \"폼\", \"듯\", \"팥\", \"멜\", \"읽\", \"맵\", \"굉\", \"껏\", \"괄\", \"셀\", \"잎\", \"촨\", \"례\", \"킵\", \"듣\", \"펀\", \"?\", \"풀\", \"챗\", \"짱\", \"겟\", \"넣\", \"랬\", \"🤕\", \"튿\", \"ㅓ\", \"쌍\", \"같\", \"Ⅰ\", \"벨\", \"죤\", \"앰\", \"밧\", \"칫\", \"쓰\", \"뿔\", \"픈\", \"즙\", \"객\", \"뻔\", \"잇\", \"놓\", \"콰\", \"캄\", \"륭\", \"팡\", \"맴\", \"긁\", \"싱\", \"👍\", \"쉘\", \"틋\", \"갖\", \"쌀\", \"뒷\", \"캔\", \"펩\", \"뵐\", \"풋\", \"➎\", \"밍\", \"렘\", \"👋\", \"럼\", \"쐐\", \"덴\", \"묻\", \"훠\", \"꺼\", \"밌\", \"뛰\", \"잊\", \"휘\", \"②\", \"➊\", \"눕\", \"낍\", \"벳\", \"ㅈ\", \"냄\", \"햄\", \"펑\", \"♧\", \"멤\", \"갭\", \"캣\", \"뜯\", \"팟\", \"낱\", \"뽐\", \"뭘\", \"깽\", \"뉘\", \"빕\", \"텔\", \"빔\", \"쾅\", \"ㅜ\", \"밝\", \"뜹\", \"며\", \"눌\", \"왜\", \"ㅍ\", \"ㅎ\", \"념\", \"뭐\", \"텍\", \"옷\", \"곳\", \"엇\", \"믿\", \"룩\", \"뭔\", \"💰\", \"즘\", \"끄\", \"섬\", \"염\", \"럭\", \"왁\", \"엡\", \"섣\", \"슨\", \"랄\", \"ㅠ\", \"눅\", \"즉\", \"찰\", \"핸\", \"씌\", \"촘\", \"떤\", \"딱\", \"⑥\", \"샷\", \"꾸\", \"섰\", \"얇\", \"냐\", \"뽀\", \"힉\", \"슝\", \"듬\", \"🦄\", \"숫\", \"잴\", \"떄\", \"팎\", \"몸\", \"ㅊ\", \"춤\", \"쾨\", \"찜\", \"맞\", \"땐\", \"갱\", \"꺄\", \"힌\", \"볕\", \"뜩\", \"낌\", \"짙\", \"삿\", \"짖\", \"💡\", \"져\", \"뜬\", \"삘\", \"∮\", \"씹\", \"웨\", \"횡\", \"팅\", \"떳\", \"끊\", \"웁\", \"딛\", \"챌\", \"롯\", \"릿\", \"눴\", \"곶\", \"많\", \"센\", \"캉\", \"춧\", \"탰\", \"」\", \"므\", \"깜\", \"쏟\", \"쳇\", \"맡\", \"홉\", \"겐\", \"찔\", \"궜\", \"좆\", \"꽂\", \"홈\", \"쉴\", \"둔\", \"렐\", \"몽\", \"죄\", \"좁\", \"솜\", \"틈\", \"닐\", \"퀵\", \"댄\", \"낳\", \"밟\", \"⑸\", \"쥰\", \"튬\", \"뷰\", \"겸\", \"괜\", \"굿\", \"줬\", \"휙\", \"∙\", \"끌\", \"텅\", \"렴\", \"곽\", \"겹\", \"짚\", \"뎀\", \"끼\", \"짠\", \"쏭\", \"깁\", \"또\", \"콕\", \"꿨\", \"싹\", \"첼\", \"🦅\", \"뉜\", \"얕\", \"뒀\", \"롱\", \"둬\", \"휠\", \"ㅞ\", \"삽\", \"①\", \"렸\", \"\", \"④\", \"✔\", \"썸\", \"곱\", \"께\", \"똥\", \"늦\", \"ᴀ\", \"웰\", \"융\", \"췄\", \"콘\", \"女\", \"💌\", \"쥐\", \"뻑\", \"섞\", \"홋\", \"쎄\", \"굶\", \"껑\", \"튜\", \"큰\", \"㎥\", \"잦\", \"폿\", \"멕\", \"샌\", \"듀\", \"척\", \"🗺\", \"쿵\", \"받\", \"걍\", \"썹\", \"빼\", \"았\", \"런\", \"품\", \"킨\", \"빤\", \"랩\", \"ᴛ\", \"⑴\", \"걷\", \"릎\", \"짝\", \"꿰\", \"③\", \"⑨\", \"틱\", \"혐\", \"했\", \"툴\", \"짭\", \"씩\", \"덮\", \"딤\", \"끝\", \"취\", \"큼\", \"탈\", \"빚\", \"옐\", \"☀\", \"ㄷ\", \"둡\", \"롤\", \"빅\", \"…\", \"촬\", \"Ⅳ\", \"높\", \"셈\", \"샹\", \"흉\", \"뜰\", \"딴\", \"💕\", \"앱\", \"觸\", \"흩\", \"퇴\", \"켐\", \"꿍\", \"냥\", \"➋\", \"롬\", \"둥\", \"끽\", \"끙\", \"꼴\", \"갚\", \"ㅒ\", \"찮\", \"쇼\", \"ㅔ\", \"쎈\", \"롸\", \"ㅚ\", \"둠\", \"꿔\", \"뤄\", \"쿠\", \"셋\", \"릴\", \"깨\", \"빴\", \"쫓\", \"槪\", \"묶\", \"렬\", \"낀\", \"셨\", \"🔹\", \"램\", \"쩔\", \"앎\", \"밸\", \"윌\", \"뀔\", \"곧\", \"앤\", \"씀\", \"텐\", \"좀\", \"셔\", \"쉼\", \"략\", \"횟\", \"낭\", \"쟤\", \"옌\", \"납\", \"퍙\", \"쁠\", \"웖\", \"​\", \"숭\", \"〮\", \"썰\", \"탭\", \"졸\", \"띈\", \"긋\", \"릇\", \"랭\", \"됐\", \"갤\", \"켰\", \"쨌\", \"갯\", \"켠\", \"ㅑ\", \"🍕\", \"렜\", \"뺐\", \"귈\", \"숱\", \"첨\", \"➍\", \"녜\", \"덩\", \"얘\", \"딪\", \"뮐\", \"캠\", \"꼭\", \"🤔\", \"똑\", \"🏫\", \"💥\", \"훗\", \"㉿\", \"킁\", \"돠\", \"👨\", \"뻗\", \"낡\", \"탓\", \"됩\", \"댔\", \"젠\", \"훌\", \"혔\", \"섹\", \"펼\", \"핵\", \"숍\", \"빌\", \"릅\", \"꾼\", \"탑\", \"휩\", \"理\", \"헨\", \"옹\", \"ㅖ\", \"앵\", \"짬\", \"쁜\", \"뿍\", \"쩐\", \"옛\", \"㉠\", \"쯤\", \"좌\", \"ㅟ\", \"ㅆ\", \"땅\", \"❏\", \"녕\", \"흑\", \"⬇\", \"씬\", \"솥\", \"닙\", \"돈\", \"팝\", \"累\", \"퓰\", \"봤\", \"홀\", \"냉\", \"움\", \"좇\", \"쫑\", \"컷\", \"캘\", \"탐\", \"s\", \"굽\", \"응\", \"앉\", \"휴\", \"큽\", \"싫\", \"줘\", \"톨\", \"識\", \"퀄\", \"헝\", \"짧\", \"흠\", \"ᴇ\", \"뚜\", \"꿕\", \"ᴍ\", \"맑\", \"「\", \"췌\", \"왘\", \"닷\", \"넉\", \"渴\", \"²\", \"킥\", \"댁\", \"힙\", \"꺾\", \"겠\", \"🤗\", \"폄\", \"쫒\", \"꽁\", \"첸\", \"뤘\", \"켜\", \"샬\", \"곁\", \"릉\", \"랍\", \"측\", \"뮬\", \"띠\", \"‪\", \"뾱\", \"궈\", \"훼\", \"😊\", \"ⅲ\", \"얏\", \"퓨\", \"℃\", \"꿀\", \"컨\", \"듐\", \"났\", \"몇\", \"뛴\", \"폰\", \"*\", \"렌\", \"땡\", \"잘\", \"턱\", \"픔\", \"꽉\", \"샤\", \"⑵\", \"🙆\", \"균\", \"낄\", \"뱃\", \"즐\", \"닭\", \"悖\", \"붐\", \"쁘\", \"➌\", \"옆\", \"낚\", \"켈\", \"삭\", \"쓸\", \"븐\", \"팔\", \"🏻\", \"流\", \"턴\", \"뺑\", \"깝\", \"핑\", \"앗\", \"곰\", \"껴\", \"놨\", \"엠\", \"맷\", \"%\", \"|\", \"땠\", \"끓\", \"꿇\", \"💅\", \"헉\", \"깐\", \"◀\", \"헤\", \"땀\", \"앓\", \"맹\", \"띄\", \"닮\", \"춥\", \"ㅢ\", \"뿌\", \"됬\", \"璣\", \"룬\", \"툭\", \"촉\", \"층\", \"ᴡ\", \"믄\", \"샀\", \"찼\", \"폐\", \"못\", \"낫\", \"쵸\", \"봬\", \"닳\", \"였\", \"멍\", \"헬\", \"팁\", \"퀸\", \"딩\", \"멈\", \"낸\", \"◐\", \"톰\", \"봄\", \"쌩\", \"💦\", \"몫\", \"윙\", \"ᴏ\", \"튼\", \"쭉\", \"넷\", \"뿜\", \"튀\", \"쭈\", \"Ⅵ\", \"맘\", \"벅\", \"읍\", \"맥\", \"탁\", \"얽\", \"➏\", \"떻\", \"렉\", \"봇\", \"잤\", \"탕\", \"홑\", \"늑\", \"걱\", \"쿤\", \"닦\", \"썅\", \"쿨\", \"헛\", \"녘\", \"헐\", \"느\", \"톱\", \"됨\", \"릭\", \"괌\", \"💣\", \"뢰\", \"뇌\", \"㏊\", \"돔\", \"률\", \"ㆍ\", \"칭\", \"멘\", \"🤟\", \"ㅅ\", \"🌵\", \"칼\", \"ⓔ\", \"긍\", \"끗\", \"쏙\", \"쐬\", \"댓\", \"흐\", \"끔\", \"樂\", \"ㅣ\", \"☎\", \"뀌\", \"쉽\", \"룸\", \"짢\", \"웬\", \"륨\", \"럿\", \"샵\", \"팩\", \"ㅘ\", \"넬\", \"🍟\", \"촌\", \"썼\", \"흘\", \"랜\", \"줏\", \"딥\", \"😭\", \"잔\", \"볍\", \"흰\", \"👏\", \"뎅\", \":\", \"혹\", \"흡\", \"뤼\", \"꽤\", \"쌈\", \"룰\", \"㎡\", \"숏\", \"셸\", \"캐\", \"춰\", \"쭙\", \"꽝\", \"녹\", \"쏜\", \"◾\", \"삣\", \"몬\", \"튄\", \"텝\", \"깅\", \"징\", \"틴\", \"쑥\", \"옮\", \"킹\", \"싼\", \"틀\", \"슴\", \"렛\", \"툰\", \"뼈\", \"펜\", \"믹\", \"샐\", \"찍\", \"앞\", \"✈\", \"🙇\", \"뛸\", \"쉰\", \"챔\", \"렀\", \"젖\", \"딘\", \"깡\", \"킬\", \"벙\", \"옴\", \"찾\", \"싸\", \"쪽\", \"픕\", \"몹\", \"立\", \"엌\", \"⑧\", \"탱\", \"뮌\", \"칸\", \"닥\", \"따\", \"렵\", \"삶\", \"챨\", \"슈\", \"냠\", \"욜\", \"뇨\", \"⑦\", \"밖\", \"델\", \"흙\", \"떨\", \"뺏\", \"㎍\", \"쌓\", \"↕\", \"넵\", \"젊\", \"줄\", \"잉\", \"쩍\", \"陸\", \"졌\", \"욕\", \"뚝\", \"ⅰ\", \"돕\", \"쥬\", \"넹\", \"착\", \"▣\", \"梁\", \"🙌\", \"탠\", \"윗\", \"‬\", \"팹\", \"논\", \"숯\", \"닿\", \"쉬\", \"잃\", \"접\", \"Ⅷ\", \"쌉\", \"캇\", \"론\", \"벵\", \"맺\", \"갔\", \"럴\", \"값\", \"옵\", \"뼘\", \"ㅐ\", \"흔\", \"켄\", \"겼\", \"쾌\", \"뮈\", \"쏘\", \"젝\", \"잰\", \"🍔\", \"똘\", \"갛\", \"텨\", \"엿\", \"쫗\", \"템\", \"@\", \"힜\", \"핫\", \"젓\", \"떠\", \"츄\", \"농\", \"딸\", \"옳\", \"팰\", \"볼\", \"흄\", \"귤\", \"놔\", \"Ⅶ\", \"낯\", \"🌿\", \"던\", \"캡\", \"🤭\", \"얼\", \"럽\", \"픽\", \"팜\", \"칠\", \"딧\", \"웠\", \"멋\", \"▷\", \"켤\", \"넘\", \"⚀\", \"핀\", \"펄\", \"찌\", \"쳤\", \"ⓒ\", \"뷔\", \"팠\", \"랴\", \"쨍\", \"쓕\", \"솨\", \"붓\", \"핥\", \"ㅡ\", \"걔\", \"飮\", \"壞\", \"먹\", \"돋\", \"렷\", \"짜\", \"쏠\", \"넥\", \"곤\", \"뭥\", \"떴\", \"◑\", \"▒\", \"뜨\", \"듈\", \"될\", \"樂\", \"굵\", \"닝\", \"띕\", \"붕\", \"틔\", \"걀\", \"엉\", \"曆\", \"🙋\", \"不\", \"큐\", \"떼\", \"❍\", \"ㅗ\", \"맬\", \"늙\", \"싯\", \"렁\", \"⑹\", \"율\", \"둘\", \"링\", \"Ⅱ\", \"쟈\", \"쳐\", \"텁\", \"엽\", \"㎞\", \"🚿\", \"깃\", \"밭\", \"靈\", \"쫄\", \"웹\", \"뚫\", \"쿄\", \"댐\", \"욥\", \"줌\", \"닛\", \"🍎\", \"Ⅸ\", \"킌\", \"줍\", \"🍰\", \"龍\", \"쓴\", \"렇\", \"즌\", \"팬\", \"🚨\", \"셉\", \"돗\", \"🍭\", \"v\", \"죠\", \"짤\", \"끈\", \"얹\", \"롭\", \"촛\", \"😂\", \"털\", \"칙\", \"◈\", \"쩡\", \"녔\", \"넌\", \"훨\", \"꼬\", \"답\", \"벽\", \"ⅱ\", \"멀\", \"쪼\", \"몰\", \"놈\", \"폈\", \"㉣\", \"갓\", \"섦\", \"찢\", \"잠\", \"콜\", \"험\", \"륙\", \"셌\", \"‍\", \"겉\", \"눠\", \"빙\", \"셜\", \"십\", \"킷\", \"떡\", \"푸\", \"⊙\", \"갉\", \"폴\", \"띤\", \"😣\", \"컬\", \"낼\", \"덧\", \"괴\", \"밉\", \"뽑\", \"뱀\", \"깔\", \"짐\", \"잭\", \"쇠\", \"쿡\", \"숨\", \"읊\", \"낙\", \"슐\", \"綃\", \"🌳\", \"엣\", \"압\", \"첩\", \"꼽\", \"짊\", \"ㅏ\", \"닌\", \"뒤\", \"펙\", \"뜻\", \"퍽\", \"Ⅴ\", \"쒀\", \"쿰\", \"늄\", \"솟\", \"봐\", \"굴\", \"굳\", \"뻤\", \"⑤\", \"콤\", \"뱉\", \"콥\", \"왠\", \"쇄\", \"봅\", \"랐\", \"텀\", \"펠\", \"쯔\", \"벼\", \"良\", \"륵\", \"혈\", \"째\", \"핍\", \"폍\", \"뻐\", \"\", \"뜸\", \"뫼\", \"벗\", \"겔\", \"뿐\", \"훅\", \"ⅳ\", \"꼈\", \"견\", \"칩\", \"😱\", \"퀀\", \"겪\", \"잖\", \"․\", \"궐\", \"젤\", \"놀\", \"‥\", \"잡\", \" \", \"뺀\", \"존\", \"랙\", \"냈\", \"묵\", \"얀\", \"빳\", \"숟\", \"흗\", \"슷\", \"웃\", \"뀐\", \"샘\", \"녁\", \"엑\", \"컸\", \"긴\", \"왔\", \"획\", \"밴\", \"㈜\", \"‎\", \"¹\", \"빗\", \"튠\", \"붙\", \"뱅\", \"멸\", \"ㄹ\", \"덜\", \"⑶\", \"써\", \"삐\", \"잼\", \"덟\", \"뭉\", \"팍\", \"탬\", \"♤\", \"ㅛ\", \"닉\", \"틸\", \"슛\", \"킴\", \"짓\", \"맛\", \"웍\", \"셰\", \"꾀\", \"썬\", \"씽\", \"랫\", \"빡\", \"ʟ\", \"냅\", \"갇\", \"덤\", \"펴\", \"둑\", \"엮\", \"퀴\", \"팽\", \"챙\", \"밑\", \"왓\", \"씻\", \"ㅋ\", \"넛\", \"퉁\", \"썩\", \"쑤\", \"🏷\", \"책\", \"엎\", \"ㄴ\", \"늬\", \"볶\", \"껀\", \"ㅝ\", \"쿼\", \"빨\", \"얄\", \"톡\"]", + "lossless": false + }, + "thu-coai/CharacterGLM-6B @ cc100/ar": { + "tokenizer": "CharacterGLM-6B", + "organization": "Tsinghua", + "vocab_size": 64789, + "_n_bytes": 2813283, + "_n_tokens": 1421847, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "thu-coai/CharacterGLM-6B @ cc100/de": { + "tokenizer": "CharacterGLM-6B", + "organization": "Tsinghua", + "vocab_size": 64789, + "_n_bytes": 1814876, + "_n_tokens": 619822, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "thu-coai/CharacterGLM-6B @ cc100/fa": { + "tokenizer": "CharacterGLM-6B", + "organization": "Tsinghua", + "vocab_size": 64789, + "_n_bytes": 2054052, + "_n_tokens": 1145051, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "thu-coai/CharacterGLM-6B @ cc100/ja": { + "tokenizer": "CharacterGLM-6B", + "organization": "Tsinghua", + "vocab_size": 64789, + "_n_bytes": 1774770, + "_n_tokens": 581380, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "thu-coai/CharacterGLM-6B @ cc100/ko": { + "tokenizer": "CharacterGLM-6B", + "organization": "Tsinghua", + "vocab_size": 64789, + "_n_bytes": 1524839, + "_n_tokens": 652160, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tiiuae/falcon-180b @ cc100/ar": { + "tokenizer": "falcon-180b", + "organization": "TII", + "vocab_size": 65024, + "_n_bytes": 2813283, + "_n_tokens": 1597443, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tiiuae/falcon-180b @ cc100/de": { + "tokenizer": "falcon-180b", + "organization": "TII", + "vocab_size": 65024, + "_n_bytes": 1814876, + "_n_tokens": 497054, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tiiuae/falcon-180b @ cc100/fa": { + "tokenizer": "falcon-180b", + "organization": "TII", + "vocab_size": 65024, + "_n_bytes": 2054052, + "_n_tokens": 1246580, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tiiuae/falcon-180b @ cc100/ja": { + "tokenizer": "falcon-180b", + "organization": "TII", + "vocab_size": 65024, + "_n_bytes": 1774770, + "_n_tokens": 842458, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tiiuae/falcon-180b @ cc100/ko": { + "tokenizer": "falcon-180b", + "organization": "TII", + "vocab_size": 65024, + "_n_bytes": 1524839, + "_n_tokens": 1330568, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tiiuae/falcon-7b @ cc100/ar": { + "tokenizer": "falcon-7b", + "organization": "TII", + "vocab_size": 65024, + "_n_bytes": 2813283, + "_n_tokens": 1597443, + "_n_chars": 1560987, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tiiuae/falcon-7b @ cc100/de": { + "tokenizer": "falcon-7b", + "organization": "TII", + "vocab_size": 65024, + "_n_bytes": 1814876, + "_n_tokens": 497054, + "_n_chars": 1784021, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tiiuae/falcon-7b @ cc100/fa": { + "tokenizer": "falcon-7b", + "organization": "TII", + "vocab_size": 65024, + "_n_bytes": 2054052, + "_n_tokens": 1246580, + "_n_chars": 1145876, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tiiuae/falcon-7b @ cc100/ja": { + "tokenizer": "falcon-7b", + "organization": "TII", + "vocab_size": 65024, + "_n_bytes": 1774770, + "_n_tokens": 842458, + "_n_chars": 603065, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tiiuae/falcon-7b @ cc100/ko": { + "tokenizer": "falcon-7b", + "organization": "TII", + "vocab_size": 65024, + "_n_bytes": 1524839, + "_n_tokens": 1330568, + "_n_chars": 655190, + "_n_oov_chars": 0, + "oov_ratio": 0.0, + "_oov_charset": "[]", + "lossless": false + }, + "tohoku-nlp/bert-base-japanese @ cc100/ar": { + "tokenizer": "bert-base-japanese", + "organization": "Tohoku", + "vocab_size": 32000, + "_n_bytes": 2813283, + "_n_tokens": 313168, + "_n_chars": 1560987, + "_n_oov_chars": 1029633, + "oov_ratio": 0.6596038275783206, + "_oov_charset": "[\"ۚ\", \"‹\", \"ή\", \"٦\", \"﴾\", \"↩\", \" \", \"😀\", \"ُ\", \"٨\", \"ί\", \"ز\", \"پ\", \"خ\", \"
\", \"ة\", \"ﻹ\", \"″\", \"إ\", \"•\", \"χ\", \"Х\", \"‏\", \"©\", \"٩\", \"ِ\", \"«\", \"…\", \"م\", \"^\", \"ى\", \"ت\", \"٤\", \"٥\", \"‬\", \"؛\", \"َ\", \"¡\", \"ً\", \"τ\", \"ه\", \"۰\", \"،\", \"ρ\", \"ث\", \"ۗ\", \"â\", \"ٍ\", \"ی\", \"‎\", \"←\", \"κ\", \"�\", \"٣\", \"۲\", \"🙂\", \"غ\", \"®\", \"ٹ\", \"ق\", \"ك\", \"ٌ\", \"ـ\", \"ج\", \"س\", \"ؤ\", \"½\", \"۸\", \"٪\", \"و\", \"ل\", \"د\", \"▪\", \"ۤ\", \"٧\", \"چ\", \"ر\", \"آ\", \"ئ\", \"ء\", \"ﷺ\", \"ک\", \"η\", \"ع\", \"٠\", \"█\", \"۷\", \"ذ\", \"😊\", \"٢\", \"‘\", \"ف\", \"ْ\", \"﴿\", \"ٱ\", \"ۖ\", \"⤴\", \"؟\", \"أ\", \"ص\", \"ﻷ\", \"١\", \"♥\", \"▫\", \"ي\", \"ھ\", \"\", \"ن\", \"ض\", \"‌\", \"ﻻ\", \"ٰ\", \"ش\", \"ّ\", \"»\", \"ب\", \"ط\", \"›\", \"ح\", \"​\", \"ظ\"]", + "lossless": false + }, + "tohoku-nlp/bert-base-japanese @ cc100/de": { + "tokenizer": "bert-base-japanese", + "organization": "Tohoku", + "vocab_size": 32000, + "_n_bytes": 1814876, + "_n_tokens": 851962, + "_n_chars": 1784021, + "_n_oov_chars": 3915, + "oov_ratio": 0.002194480894563461, + "_oov_charset": "[\"ï\", \"‹\", \"↩\", \"😀\", \"ί\", \"İ\", \"•\", \"©\", \"😆\", \"«\", \"▼\", \"…\", \"^\", \"Ã\", \"τ\", \"ń\", \"`\", \"ρ\", \"§\", \"‚\", \"â\", \"ς\", \"♡\", \"‎\", \"¹\", \"¿\", \"Ü\", \"Ä\", \"�\", \"😉\", \"🙂\", \"♦\", \"²\", \"😂\", \"û\", \"¤\", \"–\", \"☺\", \"£\", \"😃\", \"œ\", \"„\", \"½\", \"≠\", \" \", \"\", \"😦\", \"‽\", \"Á\", \"➔\", \"😈\", \"ä\", \"̈\", \"Ÿ\", \"🙁\", \"„\", \"ö\", \"ư\", \"¬\", \"‘\", \"ß\", \"€\", \"á\", \"↑\", \"ė\", \"Ö\", \"Ø\", \"¼\", \"ι\", \"¶\", \"à\", \"♥\", \"ớ\", \"™\", \"´\", \"“\", \"å\", \"­\", \"»\", \"›\", \"❤\", \"ü\", \"😢\", \"​\", \"🙄\"]", + "lossless": false + }, + "tohoku-nlp/bert-base-japanese @ cc100/fa": { + "tokenizer": "bert-base-japanese", + "organization": "Tohoku", + "vocab_size": 32000, + "_n_bytes": 2054052, + "_n_tokens": 268077, + "_n_chars": 1145876, + "_n_oov_chars": 815066, + "oov_ratio": 0.7113038409042515, + "_oov_charset": "[\"ט\", \" \", \"ُ\", \"٨\", \"ز\", \"پ\", \"خ\", \"ٴ\", \"۹\", \"ة\", \"إ\", \"•\", \"‏\", \"©\", \"ِ\", \"٩\", \"«\", \"…\", \"۶\", \"م\", \"▐\", \"✿\", \"ى\", \"ت\", \"◄\", \"٤\", \"٥\", \"؛\", \"َ\", \"ً\", \"ه\", \"۰\", \"،\", \"ث\", \"ۆ\", \"ٍ\", \"ی\", \"‎\", \"ڪ\", \"�\", \"٣\", \"۲\", \"غ\", \"۱\", \"۔\", \"ق\", \"گ\", \"ك\", \"ٌ\", \"ـ\", \"ج\", \"ּ\", \"س\", \"ؤ\", \"۸\", \"٪\", \"ﮧ\", \"و\", \"۳\", \"٫\", \"ل\", \"د\", \"٧\", \"️\", \"چ\", \"ر\", \"آ\", \"ئ\", \"ء\", \"ک\", \"ٔ\", \"ع\", \"ژ\", \"٠\", \"۷\", \"ذ\", \"ے\", \"٢\", \"‘\", \"ف\", \"ْ\", \"؟\", \"أ\", \"ۀ\", \"ص\", \"‍\", \"١\", \"♥\", \"ي\", \"ھ\", \"۴\", \"\", \"ن\", \"ض\", \"‌\", \"ش\", \"­\", \"»\", \"ّ\", \"۵\", \"ب\", \"ط\", \"›\", \"❤\", \"ح\", \"ב\", \"​\", \"ظ\"]", + "lossless": false + }, + "tohoku-nlp/bert-base-japanese @ cc100/ja": { + "tokenizer": "bert-base-japanese", + "organization": "Tohoku", + "vocab_size": 32000, + "_n_bytes": 1774770, + "_n_tokens": 384900, + "_n_chars": 603065, + "_n_oov_chars": 7871, + "oov_ratio": 0.013051661097891604, + "_oov_charset": "[\"゙\", \"テ\", \"ぉ\", \"r\", \"愉\", \"拙\", \"″\", \"́\", \"碓\", \"唸\", \"⇒\", \"▼\", \"^\", \"僭\", \"▽\", \"ロ\", \"囁\", \"磋\", \"Z\", \"◡\", \"ヽ\", \"`\", \"彡\", \"捺\", \"◎\", \"恣\", \"\\u001b\", \"◯\", \"①\", \"�\", \"Ⅹ\", \"%\", \"④\", \"俄\", \"|\", \"∀\", \"訝\", \"ゎ\", \"臆\", \"4\", \"J\", \"匙\", \"-\", \"茫\", \"ゞ\", \".\", \"靄\", \"ω\", \"0\", \"I\", \"羞\", \"ヾ\", \"趨\", \"屓\", \"$\", \"徘\", \"闊\", \"嘗\", \"=\", \"痴\", \"1\", \"\", \"頷\", \"悶\", \"レ\", \"浣\", \"徊\", \"捐\", \"托\", \"摯\", \"[\", \"Ⅱ\", \"③\", \"滓\", \"㎞\", \"L\", \"G\", \"💦\", \"韮\", \"鱈\", \"諺\", \"コ\", \"i\", \"ノ\", \"埃\", \"•\", \"衿\", \"¥\", \"+\", \";\", \"斂\", \"…\", \"謄\", \"゙\", \"◇\", \"~\", \"y\", \"8\", \"?\", \"逡\", \"⑩\", \"〆\", \"/\", \"唾\", \"←\", \"2\", \"痒\", \"攫\", \"N\", \"ぅ\", \"膿\", \"巾\", \"滲\", \"t\", \"6\", \"\", \"咳\", \"⻑\", \"箭\", \"眩\", \"垠\", \"捲\", \"慄\", \"呟\", \"□\", \"]\", \"涅\", \"馴\", \"ィ\", \"躾\", \"呆\", \"拭\", \"リ\", \"─\", \"g\", \"筈\", \"⑪\", \"誹\", \"X\", \"a\", \"゚\", \"7\", \"杞\", \"_\", \"澪\", \"悍\", \"ウ\", \"😭\", \"莽\", \"焙\", \"❤\", \"O\", \"覧\", \"C\", \"蠍\", \"②\", \"。\", \"餃\", \"​\", \"h\", \":\", \"叭\", \"姑\", \"Д\", \"k\", \"徨\", \"^\", \"©\", \"ハ\", \"杓\", \"∇\", \"謗\", \"捩\", \"A\", \"◆\", \"✧\", \"f\", \">\", \"3\", \"9\", \"喇\", \"烙\", \"姥\", \"詈\", \"鋲\", \")\", \"(\", \"ア\", \"腑\", \"ヨ\", \"&\", \"®\", \"U\", \"嵌\", \"\\b\", \"嚥\", \"フ\", \"〟\", \"︎\", \"↓\", \"b\", \"淫\", \"‼\", \"m\", \"o\", \"e\", \"瓢\", \"<\", \"゚\", \"K\", \"V\", \"忽\", \"些\", \"̈\", \"弄\", \"S\", \"逼\", \"⑧\", \"ゝ\", \"簗\", \"¥\", \"✨\", \"噤\", \"奢\", \"H\", \"E\", \"艸\", \"´\", \"欝\", \"w\", \"嗚\", \"闖\", \"R\", \"烹\", \"ㅂ\", \"F\", \"n\", \"5\", \"、\", \"🌙\", \"験\", \"s\", \"l\", \"‥\", \"飴\", \"`\", \" \", \"槃\", \"ヘ\", \"瘻\", \"淹\", \"メ\", \"碍\", \"羨\", \"«\", \"カ\", \"惑\", \"M\", \"B\", \"・\", \"愕\", \"「\", \"傲\", \"D\", \"♡\", \"丿\", \"贔\", \"貪\", \"Y\", \"恰\", \"凪\", \"屹\", \"Q\", \"ー\", \"\\", \"」\", \"d\", \"̀\", \"ゥ\", \"و\", \"啜\", \"!\", \"碌\", \"〝\", \"杼\", \"⌒\", \"@\", \"彌\", \"聾\", \"媚\", \"巷\", \"😊\", \"T\", \"℃\", \" ̄\", \"↑\", \"😌\", \"掬\", \"遜\", \"貶\", \"唆\", \"吠\", \"P\", \"灼\", \"鞄\", \"๑\", \"Ⅶ\", \"*\", \"佇\", \"»\", \"纒\", \",\", \"梳\", \"截\", \"W\", \"琢\", \"膏\", \"▷\", \"😢\", \"⇔\", \"舐\", \"♫\"]", + "lossless": false + }, + "tohoku-nlp/bert-base-japanese @ cc100/ko": { + "tokenizer": "bert-base-japanese", + "organization": "Tohoku", + "vocab_size": 32000, + "_n_bytes": 1524839, + "_n_tokens": 207392, + "_n_chars": 655190, + "_n_oov_chars": 466411, + "oov_ratio": 0.7118713655580824, + "_oov_charset": "[\"윈\", \"드\", \"싣\", \"譯\", \"칵\", \"섯\", \"🥁\", \"미\", \"을\", \"펌\", \"싶\", \"퀘\", \"뭇\", \"묘\", \"폭\", \"룡\", \"^\", \"훔\", \"츈\", \"😗\", \"ㅙ\", \"Ⅲ\", \"잣\", \"른\", \"밀\", \"및\", \"근\", \"붉\", \"훑\", \"액\", \"껍\", \"參\", \"샴\", \"린\", \"업\", \"맙\", \"빵\", \"힐\", \"쫀\", \"푹\", \"꺽\", \"얻\", \"└\", \"Ⅹ\", \"믐\", \"쁨\", \"궤\", \"남\", \"햇\", \"숲\", \"밋\", \"ㅁ\", \"유\", \"늘\", \"뵙\", \"돼\", \"네\", \"쥔\", \"은\", \"넨\", \"듭\", \"륜\", \"특\", \"룹\", \"댈\", \"ㅕ\", \"️\", \"힘\", \"핏\", \"억\", \"겁\", \"딜\", \"榮\", \"🍞\", \"깥\", \"ᴄ\", \"앨\", \"위\", \"푼\", \"툼\", \"콩\", \"왼\", \"뗀\", \"음\", \"결\", \"專\", \"낮\", \"ㄱ\", \"구\", \"⁴\", \"작\", \"눔\", \"♣\", \"金\", \"禮\", \"◦\", \"팀\", \"­\", \"넓\", \"☞\", \"쬐\", \"ㅇ\", \"경\", \"득\", \"덥\", \"쩌\", \"㉰\", \"벚\", \"쪄\", \"얍\", \"켓\", \"닫\", \"송\", \"💸\", \"톤\", \"혀\", \"卽\", \"폼\", \"듯\", \"팥\", \"멜\", \"포\", \"읽\", \"맵\", \"굉\", \"껏\", \"괄\", \"셀\", \"속\", \"잎\", \"촨\", \"다\", \"례\", \"킵\", \"듣\", \"펀\", \"⋅\", \"컴\", \"?\", \"친\", \"풀\", \"ã\", \"챗\", \"짱\", \"목\", \"겟\", \"넣\", \"랬\", \"🤕\", \"란\", \"온\", \"튿\", \"ㅓ\", \"쌍\", \"같\", \"본\", \"Ⅰ\", \"벨\", \"이\", \"승\", \"죤\", \"앰\", \"밧\", \"칫\", \"쓰\", \"먼\", \"뿔\", \"픈\", \"투\", \"련\", \"로\", \"즙\", \"객\", \"뻔\", \"잇\", \"놓\", \"콰\", \"캄\", \"륭\", \"팡\", \"맴\", \"긁\", \"싱\", \"좋\", \"👍\", \"북\", \"쉘\", \"틋\", \"갖\", \"증\", \"쌀\", \"뒷\", \"캔\", \"펩\", \"뵐\", \"풋\", \"➎\", \"밍\", \"렘\", \"👋\", \"표\", \"럼\", \"쐐\", \"손\", \"덴\", \"묻\", \"훠\", \"꺼\", \"밌\", \"뛰\", \"마\", \"협\", \"맨\", \"잊\", \"휘\", \"격\", \"②\", \"➊\", \"눕\", \"낍\", \"벳\", \"ㅈ\", \"냄\", \"햄\", \"펑\", \"♧\", \"갭\", \"멤\", \"디\", \"캣\", \"춘\", \"뜯\", \"팟\", \"낱\", \"각\", \"◆\", \"뽐\", \"뭘\", \"깽\", \"뉘\", \"빕\", \"텔\", \"용\", \"준\", \"빔\", \"쾅\", \"ㅜ\", \"에\", \"밝\", \"뜹\", \"며\", \"록\", \"눌\", \"왜\", \"ㅎ\", \"ㅍ\", \"념\", \"뭐\", \"그\", \"러\", \"텍\", \"옷\", \"곳\", \"테\", \"엇\", \"믿\", \"룩\", \"뭔\", \"💰\", \"만\", \"燭\", \"즘\", \"끄\", \"섬\", \"염\", \"럭\", \"명\", \"왁\", \"엡\", \"섣\", \"↓\", \"슨\", \"랄\", \"ㅠ\", \"눅\", \"즉\", \"빛\", \"치\", \"호\", \"찰\", \"별\", \"성\", \"핸\", \"씌\", \"식\", \"촘\", \"♀\", \"떤\", \"딱\", \"완\", \"⑥\", \"왕\", \"샷\", \"꾸\", \"시\", \"섰\", \"설\", \"씨\", \"얇\", \"냐\", \"뽀\", \"♥\", \"힉\", \"슝\", \"듬\", \"최\", \"🦄\", \"향\", \"숫\", \"잴\", \"케\", \"떄\", \"팎\", \"합\", \"몸\", \"ㅊ\", \"옥\", \"애\", \"춤\", \"쾨\", \"찜\", \"맞\", \"현\", \"수\", \"카\", \"땐\", \"암\", \"갱\", \"꺄\", \"힌\", \"볕\", \"戌\", \"뜩\", \"낌\", \"짙\", \"삿\", \"짖\", \"💡\", \"베\", \"져\", \"뜬\", \"삘\", \"∮\", \"씹\", \"웨\", \"횡\", \"팅\", \"막\", \"떳\", \"끊\", \"웁\", \"딛\", \"보\", \"챌\", \"롯\", \"♡\", \"릿\", \"눴\", \"난\", \"력\", \"곶\", \"패\", \"많\", \"바\", \"센\", \"캉\", \"게\", \"춧\", \"창\", \"탰\", \"」\", \"병\", \"므\", \"없\", \"깜\", \"黃\", \"쏟\", \"쳇\", \"맡\", \"홉\", \"안\", \"당\", \"언\", \"겐\", \"찔\", \"궜\", \"좆\", \"꽂\", \"홈\", \"돌\", \"쉴\", \"둔\", \"광\", \"렐\", \"緞\", \"몽\", \"죄\", \"습\", \"루\", \"좁\", \"상\", \"濟\", \"솜\", \"틈\", \"€\", \"워\", \"닐\", \"퀵\", \"댄\", \"낳\", \"밟\", \"⑸\", \"쥰\", \"플\", \"튬\", \"뷰\", \"겸\", \"괜\", \"굿\", \"줬\", \"휙\", \"역\", \"»\", \"≤\", \"∙\", \"끌\", \"吳\", \"텅\", \"채\", \"렴\", \"겨\", \"곽\", \"파\", \"첫\", \"공\", \"겹\", \"야\", \"藥\", \"對\", \"짚\", \"기\", \"뎀\", \"屠\", \"끼\", \"짠\", \"슬\", \"쏭\", \"깁\", \"또\", \"콕\", \"티\", \"꿨\", \"션\", \"첼\", \"싹\", \"🦅\", \"◼\", \"김\", \"뉜\", \"얕\", \"뒀\", \"롱\", \"둬\", \"휠\", \"ㅞ\", \"삽\", \"①\", \"렸\", \"�\", \"\", \"④\", \"함\", \"✔\", \"썸\", \"곱\", \"께\", \"똥\", \"늦\", \"ᴀ\", \"비\", \"중\", \"류\", \"웰\", \"將\", \"융\", \"환\", \"췄\", \"해\", \"콘\", \"女\", \"새\", \"💌\", \"쥐\", \"뻑\", \"섞\", \"홋\", \"ω\", \"쎄\", \"굶\", \"껑\", \"튜\", \"큰\", \"㎥\", \"잦\", \"폿\", \"멕\", \"샌\", \"듀\", \"척\", \"🗺\", \"쿵\", \"받\", \"밤\", \"▶\", \"걍\", \"썹\", \"빼\", \"았\", \"백\", \"런\", \"敎\", \"품\", \"길\", \"름\", \"원\", \"킨\", \"빤\", \"까\", \"랩\", \"ᴛ\", \"⑴\", \"걷\", \"섭\", \"릎\", \"짝\", \"꿰\", \"③\", \"⑨\", \"틱\", \"혐\", \"했\", \"는\", \"���\", \"劍\", \"짭\", \"씩\", \"덮\", \"교\", \"문\", \"한\", \"딤\", \"끝\", \"취\", \"활\", \"琪\", \"큼\", \"탈\", \"빚\", \"옐\", \"☀\", \"ㄷ\", \"림\", \"둡\", \"군\", \"능\", \"롤\", \"빅\", \"불\", \"…\", \"촬\", \"전\", \"Ⅳ\", \"높\", \"셈\", \"샹\", \"淨\", \"흉\", \"뜰\", \"딴\", \"💕\", \"앱\", \"觸\", \"흩\", \"퇴\", \"켐\", \"들\", \"냥\", \"꿍\", \"➋\", \"족\", \"롬\", \"둥\", \"←\", \"끽\", \"고\", \"끙\", \"꼴\", \"갚\", \"ㅒ\", \"찮\", \"쇼\", \"항\", \"ㅔ\", \"양\", \"쎈\", \"燦\", \"무\", \"롸\", \"행\", \"말\", \"□\", \"ㅚ\", \"브\", \"둠\", \"때\", \"꿔\", \"뤄\", \"쿠\", \"셋\", \"익\", \"릴\", \"깨\", \"빴\", \"經\", \"꿈\", \"궁\", \"쫓\", \"槪\", \"대\", \"묶\", \"렬\", \"든\", \"낀\", \"셨\", \"內\", \"🔹\", \"램\", \"쩔\", \"레\", \"밸\", \"앎\", \"윌\", \"평\", \"뀔\", \"곧\", \"앤\", \"씀\", \"텐\", \"좀\", \"셔\", \"쉼\", \"략\", \"범\", \"횟\", \"낭\", \"쟤\", \"옌\", \"납\", \"려\", \"퍙\", \"쁠\", \"악\", \"웖\", \"​\", \"숭\", \"〮\", \"썰\", \"탭\", \"트\", \"졸\", \"띈\", \"긋\", \"릇\", \"아\", \"랭\", \"됐\", \"예\", \"갤\", \"찬\", \"초\", \"假\", \"켰\", \"민\", \"쨌\", \"홍\", \"않\", \"갯\", \"갑\", \"켠\", \"ㅑ\", \"悧\", \"🍕\", \"리\", \"거\", \"렜\", \"뺐\", \"귈\", \"혼\", \"숱\", \"첨\", \"➍\", \"간\", \"녜\", \"덩\", \"얘\", \"허\", \"딪\", \"뮐\", \"캠\", \"꼭\", \"賣\", \"🤔\", \"똑\", \"🏫\", \"래\", \"💥\", \"훗\", \"㉿\", \"곡\", \"킁\", \"돠\", \"👨\", \"뻗\", \"낡\", \"탓\", \"關\", \"회\", \"됩\", \"댔\", \"젠\", \"열\", \"훌\", \"價\", \"혔\", \"섹\", \"펼\", \"핵\", \"숍\", \"법\", \"빌\", \"릅\", \"임\", \"꾼\", \"탑\", \"휩\", \"데\", \"理\", \"된\", \"헨\", \"옹\", \"ㅖ\", \"앵\", \"짬\", \"쁜\", \"뿍\", \"쩐\", \"옛\", \"㉠\", \"쯤\", \"좌\", \"ㅟ\", \"ㅆ\", \"땅\", \"❏\", \"녕\", \"흑\", \"⬇\", \"어\", \"씬\", \"관\", \"솥\", \"發\", \"닙\", \"돈\", \"팝\", \"累\", \"퓰\", \"봤\", \"홀\", \"냉\", \"움\", \"좇\", \"욱\", \"쫑\", \"컷\", \"캘\", \"탐\", \"s\", \"굽\", \"응\", \"앉\", \"휴\", \"큽\", \"싫\", \"줘\", \"톨\", \"識\", \"님\", \"퀄\", \"라\", \"헝\", \"짧\", \"참\", \"흠\", \"ᴇ\", \"생\", \"뚜\", \"컵\", \"꿕\", \"ᴍ\", \"맑\", \"「\", \"췌\", \"희\", \"왘\", \"戮\", \"닷\", \"넉\", \"渴\", \"감\", \"²\", \"킥\", \"눈\", \"댁\", \"힙\", \"꺾\", \"겠\", \"🤗\", \"클\", \"폄\", \"쫒\", \"꽁\", \"첸\", \"빠\", \"박\", \"뤘\", \"켜\", \"跏\", \"샬\", \"곁\", \"릉\", \"동\", \"번\", \"랍\", \"측\", \"뮬\", \"띠\", \"‪\", \"저\", \"빈\", \"뾱\", \"궈\", \"훼\", \"😊\", \"ⅲ\", \"얏\", \"퓨\", \"℃\", \"꿀\", \"컨\", \"듐\", \"배\", \"갈\", \"났\", \"몇\", \"뛴\", \"처\", \"폰\", \"*\", \"렌\", \"\", \"땡\", \"잘\", \"턱\", \"픔\", \"꽉\", \"샤\", \"⑵\", \"🙆\", \"균\", \"獻\", \"낄\", \"뱃\", \"즐\", \"닭\", \"청\", \"숙\", \"悖\", \"붐\", \"연\", \"쁘\", \"➌\", \"옆\", \"락\", \"낚\", \"켈\", \"크\", \"삭\", \"▼\", \"죽\", \"쓸\", \"제\", \"택\", \"븐\", \"질\", \"팔\", \"확\", \"🏻\", \"요\", \"流\", \"직\", \"턴\", \"뺑\", \"깝\", \"울\", \"핑\", \"`\", \"앗\", \"곰\", \"껴\", \"적\", \"놨\", \"여\", \"◎\", \"엠\", \"맷\", \"歲\", \"퍼\", \"%\", \"피\", \"ɪ\", \"커\", \"|\", \"땠\", \"끓\", \"꿇\", \"💅\", \"헉\", \"깐\", \"웅\", \"◀\", \"헤\", \"땀\", \"앓\", \"맹\", \"띄\", \"닮\", \"춥\", \"ㅢ\", \"깊\", \"세\", \"일\", \"뿌\", \"됬\", \"璣\", \"룬\", \"실\", \"귀\", \"鎭\", \"툭\", \"면\", \"촉\", \"층\", \"ᴡ\", \"믄\", \"샀\", \"찼\", \"폐\", \"못\", \"낫\", \"쵸\", \"봬\", \"닳\", \"였\", \"멍\", \"헬\", \"팁\", \"퀸\", \"딩\", \"멈\", \"낸\", \"◐\", \"톰\", \"봄\", \"쌩\", \"더\", \"💦\", \"몫\", \"윙\", \"ᴏ\", \"튼\", \"쭉\", \"넷\", \"獨\", \"뿜\", \"튀\", \"쭈\", \"Ⅵ\", \"맘\", \"벅\", \"읍\", \"맥\", \"•\", \"탁\", \"얽\", \"➏\", \"소\", \"떻\", \"두\", \"렉\", \"봇\", \"잤\", \"韜\", \"탕\", \"홑\", \"히\", \"정\", \"늑\", \"걱\", \"쿤\", \"를\", \"닦\", \"썅\", \"쿨\", \"페\", \"헛\", \"살\", \"녘\", \"헐\", \"즈\", \"삼\", \"느\", \"톱\", \"됨\", \"릭\", \"괌\", \"💣\", \"주\", \"뢰\", \"뇌\", \"블\", \"㏊\", \"검\", \"돔\", \"률\", \"달\", \"흥\", \"ㆍ\", \"칭\", \"멘\", \"🤟\", \"건\", \"ㅅ\", \"🌵\", \"칼\", \"황\", \"ⓔ\", \"긍\", \"끗\", \"버\", \"쏙\", \"쐬\", \"앙\", \"댓\", \"흐\", \"끔\", \"樂\", \"ㅣ\", \"☎\", \"뀌\", \"쉽\", \"룸\", \"짢\", \"재\", \"웬\", \"德\", \"륨\", \"럿\", \"蟄\", \"등\", \"샵\", \"팩\", \"ㅘ\", \"변\", \"넬\", \"탄\", \"발\", \"🍟\", \"촌\", \"벤\", \"있\", \"썼\", \"흘\", \"랜\", \"諒\", \"줏\", \"딥\", \"😭\", \"조\", \"잔\", \"볍\", \"❤\", \"엔\", \"흰\", \"👏\", \"뎅\", \":\", \"육\", \"혹\", \"흡\", \"뤼\", \"꽤\", \"쌈\", \"룰\", \"㎡\", \"숏\", \"셸\", \"캐\", \"춰\", \"쭙\", \"꽝\", \"녹\", \"쏜\", \"◾\", \"후\", \"삣\", \"몬\", \"튄\", \"텝\", \"깅\", \"징\", \"널\", \"틴\", \"쑥\", \"혜\", \"것\", \"옮\", \"킹\", \"싼\", \"§\", \"권\", \"틀\", \"인\", \"슴\", \"렛\", \"툰\", \"뼈\", \"펜\", \"믹\", \"샐\", \"찍\", \"앞\", \"靑\", \"✈\", \"순\", \"🙇\", \"할\", \"®\", \"뛸\", \"쉰\", \"챔\", \"렀\", \"젖\", \"雙\", \"딘\", \"깡\", \"킬\", \"榜\", \"尤\", \"벙\", \"으\", \"옴\", \"찾\", \"월\", \"싸\", \"쪽\", \"픕\", \"몹\", \"날\", \"키\", \"立\", \"엄\", \"엌\", \"⑧\", \"탱\", \"뮌\", \"계\", \"칸\", \"닥\", \"따\", \"렵\", \"삶\", \"챨\", \"슈\", \"峴\", \"냠\", \"욜\", \"뇨\", \"⑦\", \"밖\", \"델\", \"흙\", \"떨\", \"뺏\", \"점\", \"의\", \"반\", \"통\", \"윤\", \"變\", \"터\", \"臺\", \"녀\", \"㎍\", \"쌓\", \"약\", \"↕\", \"넵\", \"젊\", \"오\", \"줄\", \"필\", \"‧\", \"잉\", \"도\", \"총\", \"쩍\", \"陸\", \"가\", \"졌\", \"형\", \"욕\", \"뚝\", \"ⅰ\", \"꽃\", \"돕\", \"쥬\", \"과\", \"넹\", \"착\", \"▣\", \"년\", \"梁\", \"🙌\", \"탠\", \"윗\", \"‬\", \"팹\", \"논\", \"르\", \"숯\", \"닿\", \"쉬\", \"ń\", \"훈\", \"방\", \"잃\", \"접\", \"Ⅷ\", \"혁\", \"쌉\", \"캇\", \"태\", \"론\", \"벵\", \"맺\", \"갔\", \"럴\", \"값\", \"옵\", \"편\", \"뼘\", \"ㅐ\", \"진\", \"흔\", \"켄\", \"겼\", \"효\", \"침\", \"쾌\", \"뮈\", \"쏘\", \"젝\", \"잰\", \"뮤\", \"🍔\", \"똘\", \"갛\", \"텨\", \"엿\", \"쫗\", \"템\", \"@\", \"힜\", \"핫\", \"솔\", \"젓\", \"엘\", \"‘\", \"떠\", \"↑\", \"절\", \"츄\", \"농\", \"딸\", \"옳\", \"팰\", \"볼\", \"너\", \"흄\", \"귤\", \"놔\", \"Ⅶ\", \"낯\", \"🌿\", \"던\", \"캡\", \"🤭\", \"부\", \"출\", \"얼\", \"럽\", \"픽\", \"팜\", \"칠\", \"딧\", \"웠\", \"멋\", \"▷\", \"켤\", \"넘\", \"⚀\", \"핀\", \"펄\", \"찌\", \"쳤\", \"ⓒ\", \"氣\", \"數\", \"뷔\", \"팠\", \"랴\", \"심\", \"올\", \"쨍\", \"쓕\", \"⇒\", \"솨\", \"종\", \"붓\", \"알\", \"핥\", \"ㅡ\", \"메\", \"극\", \"걔\", \"료\", \"飮\", \"壞\", \"먹\", \"돋\", \"타\", \"렷\", \"골\", \"짜\", \"쏠\", \"랑\", \"넥\", \"곤\", \"뭥\", \"떴\", \"독\", \"◑\", \"▒\", \"≫\", \"뜨\", \"선\", \"듈\", \"璿\", \"쟁\", \"蚩\", \"될\", \"樂\", \"굵\", \"닝\", \"띕\", \"붕\", \"틔\", \"걀\", \"誡\", \"엉\", \"曆\", \"🙋\", \"不\", \"큐\", \"떼\", \"❍\", \"ㅗ\", \"철\", \"맬\", \"늙\", \"싯\", \"국\", \"렁\", \"⑹\", \"밥\", \"망\", \"석\", \"뉴\", \"율\", \"贖\", \"둘\", \"나\", \"봉\", \"링\", \"산\", \"Ⅱ\", \"쳐\", \"趺\", \"쟈\", \"량\", \"텁\", \"엽\", \"㎞\", \"규\", \"🚿\", \"사\", \"깃\", \"밭\", \"靈\", \"코\", \"弛\", \"쫄\", \"차\", \"웹\", \"분\", \"뚫\", \"매\", \"쿄\", \"댐\", \"개\", \"욥\", \"줌\", \"닛\", \"🍎\", \"Ⅸ\", \"킌\", \"줍\", \"◇\", \"峙\", \"🍰\", \"노\", \"와\", \"龍\", \"쓴\", \"렇\", \"즌\", \"팬\", \"🚨\", \"셉\", \"돗\", \"술\", \"내\", \"🍭\", \"v\", \"↔\", \"었\", \"죠\", \"짤\", \"끈\", \"얹\", \"장\", \"스\", \"롭\", \"촛\", \"😂\", \"털\", \"풍\", \"칙\", \"◈\", \"쩡\", \"녔\", \"£\", \"넌\", \"훨\", \"꼬\", \"답\", \"벽\", \"ⅱ\", \"멀\", \"쪼\", \"몰\", \"모\", \"놈\", \"폈\", \"㉣\", \"천\", \"갓\", \"섦\", \"물\", \"찢\", \"잠\", \"콜\", \"험\", \"령\", \"륙\", \"셌\", \"‍\", \"겉\", \"눠\", \"빙\", \"셜\", \"십\", \"킷\", \"떡\", \"추\", \"츠\", \"외\", \"푸\", \"⊙\", \"›\", \"갉\", \"하\", \"덕\", \"폴\", \"띤\", \"누\", \"😣\", \"컬\", \"금\", \" \", \"낼\", \"덧\", \"괴\", \"밉\", \"뽑\", \"©\", \"헌\", \"뱀\", \"깔\", \"색\", \"짐\", \"잭\", \"걸\", \"쇠\", \"쿡\", \"숨\", \"俠\", \"읊\", \"낙\", \"說\", \"슐\", \"綃\", \"🌳\", \"토\", \"엣\", \"압\", \"첩\", \"꼽\", \"짊\", \"體\", \"擒\", \"벌\", \"ʏ\", \"ㅏ\", \"펙\", \"닌\", \"뒤\", \"충\", \"뜻\", \"︎\", \"퍽\", \"Ⅴ\", \"강\", \"쒀\", \"쿰\", \"늄\", \"지\", \"봐\", \"솟\", \"굴\", \"굳\", \"뻤\", \"⑤\", \"콤\", \"급\", \"뱉\", \"콥\", \"왠\", \"쇄\", \"≪\", \"봅\", \"단\", \"랐\", \"텀\", \"펠\", \"쯔\", \"화\", \"벼\", \"축\", \"良\", \"륵\", \"혈\", \"째\", \"핍\", \"폍\", \"뻐\", \"∼\", \"\", \"뜸\", \"뫼\", \"벗\", \"겔\", \"뿐\", \"훅\", \"ⅳ\", \"꼈\", \"람\", \"판\", \"견\", \"칩\", \"😱\", \"프\", \"퀀\", \"臀\", \"복\", \"겪\", \"잖\", \"운\", \"․\", \"궐\", \"집\", \"젤\", \"놀\", \"‥\", \"잡\", \" \", \"뺀\", \"존\", \"랙\", \"냈\", \"묵\", \"얀\", \"빳\", \"숟\", \"흗\", \"슷\", \"니\", \"웃\", \"립\", \"뀐\", \"샘\", \"녁\", \"엑\", \"컸\", \"긴\", \"왔\", \"획\", \"밴\", \"㈜\", \"‎\", \"¹\", \"빗\", \"튠\", \"붙\", \"뱅\", \"멸\", \"ㄹ\", \"劫\", \"덜\", \"⑶\", \"써\", \"삐\", \"잼\", \"덟\", \"뭉\", \"팍\", \"자\", \"탬\", \"♤\", \"ㅛ\", \"닉\", \"체\", \"틸\", \"서\", \"슛\", \"킴\", \"우\", \"글\", \"되\", \"짓\", \"맛\", \"담\", \"웍\", \"셰\", \"꾀\", \"썬\", \"학\", \"씽\", \"랫\", \"빡\", \"ʟ\", \"냅\", \"갇\", \"덤\", \"펴\", \"둑\", \"엮\", \"입\", \"퀴\", \"팽\", \"챙\", \"밑\", \"왓\", \"씻\", \"ㅋ\", \"拜\", \"넛\", \"퉁\", \"썩\", \"쑤\", \"🏷\", \"책\", \"엎\", \"ㄴ\", \"늬\", \"신\", \"볶\", \"머\", \"껀\", \"ㅝ\", \"쿼\", \"영\", \"빨\", \"얄\", \"톡\"]", + "lossless": false } } \ No newline at end of file