THUDM
/

chatglm-6b

@@ -193,6 +193,7 @@ class ChatGLMTokenizer(PreTrainedTokenizer):
             num_image_tokens=20000,
             **kwargs
     ) -> None:
         super().__init__(
             do_lower_case=do_lower_case,
             remove_space=remove_space,
@@ -218,8 +219,6 @@ class ChatGLMTokenizer(PreTrainedTokenizer):
         self.mask_token = mask_token
         self.gmask_token = gmask_token
-        self.sp_tokenizer = SPTokenizer(vocab_file, num_image_tokens=num_image_tokens)
         """ Initialisation """
     @property

             num_image_tokens=20000,
             **kwargs
     ) -> None:
+        self.sp_tokenizer = SPTokenizer(vocab_file, num_image_tokens=num_image_tokens)
         super().__init__(
             do_lower_case=do_lower_case,
             remove_space=remove_space,
         self.mask_token = mask_token
         self.gmask_token = gmask_token
         """ Initialisation """
     @property