OCR-Translate

Sleeping

pablocst commited on Nov 21, 2023

Commit

ddafa36

•

1 Parent(s): cadc650

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,7 +11,8 @@ import nltk
 import pyclip
 import pytesseract
 from nltk.tokenize import sent_tokenize
-from transformers import MarianMTModel, MarianTokenizer
 nltk.download('punkt')
@@ -33,8 +34,11 @@ def model_choice(src, trg):
     # https://huggingface.co/unicamp-dl/translation-en-pt-t5
     model_name = f"unicamp-dl/translation-{src}-{trg}-t5"  # 模型名称
-    tokenizer = MarianTokenizer.from_pretrained(model_name)  # 分词器
-    model = MarianMTModel.from_pretrained(model_name)  # 模型
     return tokenizer, model

 import pyclip
 import pytesseract
 from nltk.tokenize import sent_tokenize
+#from transformers import MarianMTModel, MarianTokenizer
+from transformers import T5Tokenizer, T5ForConditionalGeneration
 nltk.download('punkt')
     # https://huggingface.co/unicamp-dl/translation-en-pt-t5
     model_name = f"unicamp-dl/translation-{src}-{trg}-t5"  # 模型名称
+    #tokenizer = MarianTokenizer.from_pretrained(model_name)  # 分词器
+    #model = MarianMTModel.from_pretrained(model_name)  # 模型
+    tokenizer = T5Tokenizer.from_pretrained(model_name)
+    model = T5ForConditionalGeneration.from_pretrained(model_name)
     return tokenizer, model