utrobinmv
/

t5_translate_en_ru_zh_large_1024

text2text-generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

utrobinmv commited on Mar 13

Commit

d004108

•

1 Parent(s): 4b911d6

feat add no_repeat_ngram

Files changed (2) hide show

README.md +8 -2
generation_config.json +1 -0

README.md CHANGED Viewed

@@ -42,8 +42,11 @@ Example translate Russian to Chinese
 ```python
 from transformers import T5ForConditionalGeneration, T5Tokenizer
 model_name = 'utrobinmv/t5_translate_en_ru_zh_large_1024'
 model = T5ForConditionalGeneration.from_pretrained(model_name)
 tokenizer = T5Tokenizer.from_pretrained(model_name)
 prefix = 'translate to zh: '
@@ -52,7 +55,7 @@ src_text = prefix + "Съешь ещё этих мягких французск
 # translate Russian to Chinese
 input_ids = tokenizer(src_text, return_tensors="pt")
-generated_tokens = model.generate(**input_ids)
 result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 print(result)
@@ -66,8 +69,11 @@ and Example translate Chinese to Russian
 ```python
 from transformers import T5ForConditionalGeneration, T5Tokenizer
 model_name = 'utrobinmv/t5_translate_en_ru_zh_large_1024'
 model = T5ForConditionalGeneration.from_pretrained(model_name)
 tokenizer = T5Tokenizer.from_pretrained(model_name)
 prefix = 'translate to ru: '
@@ -76,7 +82,7 @@ src_text = prefix + "再吃这些法国的甜蜜的面包。"
 # translate Russian to Chinese
 input_ids = tokenizer(src_text, return_tensors="pt")
-generated_tokens = model.generate(**input_ids)
 result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 print(result)

 ```python
 from transformers import T5ForConditionalGeneration, T5Tokenizer
+device = 'cuda' #or 'cpu' for translate on cpu
 model_name = 'utrobinmv/t5_translate_en_ru_zh_large_1024'
 model = T5ForConditionalGeneration.from_pretrained(model_name)
+model.to(device)
 tokenizer = T5Tokenizer.from_pretrained(model_name)
 prefix = 'translate to zh: '
 # translate Russian to Chinese
 input_ids = tokenizer(src_text, return_tensors="pt")
+generated_tokens = model.generate(**input_ids,to(device))
 result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 print(result)
 ```python
 from transformers import T5ForConditionalGeneration, T5Tokenizer
+device = 'cuda' #or 'cpu' for translate on cpu
 model_name = 'utrobinmv/t5_translate_en_ru_zh_large_1024'
 model = T5ForConditionalGeneration.from_pretrained(model_name)
+model.to(device)
 tokenizer = T5Tokenizer.from_pretrained(model_name)
 prefix = 'translate to ru: '
 # translate Russian to Chinese
 input_ids = tokenizer(src_text, return_tensors="pt")
+generated_tokens = model.generate(**input_ids,to(device))
 result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 print(result)

generation_config.json CHANGED Viewed

@@ -5,5 +5,6 @@
   "max_new_tokens": 1024,
   "repetition_penalty": 5.0,
   "num_beams": 5,
   "transformers_version": "4.33.0"
 }

   "max_new_tokens": 1024,
   "repetition_penalty": 5.0,
   "num_beams": 5,
+  "no_repeat_ngram_size": 3,
   "transformers_version": "4.33.0"
 }