p1atdev
/

dart-v1-sft

Text Generation

text-generation-inference

Model card Files Files and versions Community

p1atdev commited on Feb 22

Commit

ce448ae

•

1 Parent(s): b1c8d19

Update tokenization_dart.py

Files changed (1) hide show

tokenization_dart.py +1 -23

tokenization_dart.py CHANGED Viewed

@@ -1,7 +1,5 @@
 import logging
-import json
-from typing import Dict, List
-from pydantic.dataclasses import dataclass
 from transformers import PreTrainedTokenizerFast
 from tokenizers.decoders import Decoder
@@ -57,26 +55,6 @@ PROMPT_TEMPLATE = (
 # fmt: on
-@dataclass
-class Category:
-    name: str
-    bos_token_id: int
-    eos_token_id: int
-@dataclass
-class TagCategoryConfig:
-    categories: Dict[str, Category]
-    category_to_token_ids: Dict[str, List[int]]
-def load_tag_category_config(config_json: str):
-    with open(config_json, "rb") as file:
-        config: TagCategoryConfig = TagCategoryConfig(**json.loads(file.read()))
-    return config
 class DartDecoder:
     def __init__(self, special_tokens: List[str]):
         self.special_tokens = list(special_tokens)

 import logging
+from typing import List
 from transformers import PreTrainedTokenizerFast
 from tokenizers.decoders import Decoder
 # fmt: on
 class DartDecoder:
     def __init__(self, special_tokens: List[str]):
         self.special_tokens = list(special_tokens)