if001
/

sentencepiece_ja

Model card Files Files and versions Community

if001 commited on Oct 21, 2023

Commit

0e4910a

•

1 Parent(s): 15608e1

fix vocab_size to property

Files changed (2) hide show

sentencepiece_ja.py +3 -2
tokenizer_config.json +2 -1

sentencepiece_ja.py CHANGED Viewed

@@ -28,10 +28,11 @@ class SentencePieceJA(PreTrainedTokenizer):
             'unk_token': unk,
             'mask_token': mask
         })
     def get_vocab(self) -> int:
         return self._tokenizer.get_vocab()
     def vocab_size(self) -> int:
         return self._tokenizer.get_vocab_size()

             'unk_token': unk,
             'mask_token': mask
         })
     def get_vocab(self) -> int:
         return self._tokenizer.get_vocab()
+    @property
     def vocab_size(self) -> int:
         return self._tokenizer.get_vocab_size()

tokenizer_config.json CHANGED Viewed

@@ -9,5 +9,6 @@
   "tokenizer_class": "SentencePieceJA",
   "auto_map": {
     "AutoTokenizer": ["","sentencepiece_ja.SentencePieceJA"]
-  }
 }

   "tokenizer_class": "SentencePieceJA",
   "auto_map": {
     "AutoTokenizer": ["","sentencepiece_ja.SentencePieceJA"]
+  },
+  "transformers_version": " 4.34.1"
 }