dicta-il
/

dictabert-morph

Feature Extraction

text-embeddings-inference

Model card Files Files and versions Community

Shaltiel commited on Aug 31, 2023

Commit

07f6795

•

1 Parent(s): c8e7a7f

Added truncation for long sequences

Files changed (1) hide show

BertForMorphTagging.py +1 -1

BertForMorphTagging.py CHANGED Viewed

@@ -139,7 +139,7 @@ class BertForMorphTagging(BertPreTrainedModel):
     def predict(self, sentences: List[str], tokenizer: BertTokenizerFast, padding='longest'):
         # tokenize the inputs and convert them to relevant device
-        inputs = tokenizer(sentences, padding=padding, return_tensors='pt')
         inputs = {k:v.to(self.device) for k,v in inputs.items()}
         # calculate the logits
         logits = self.forward(**inputs, return_dict=True).logits

     def predict(self, sentences: List[str], tokenizer: BertTokenizerFast, padding='longest'):
         # tokenize the inputs and convert them to relevant device
+        inputs = tokenizer(sentences, padding=padding, truncation=True, return_tensors='pt')
         inputs = {k:v.to(self.device) for k,v in inputs.items()}
         # calculate the logits
         logits = self.forward(**inputs, return_dict=True).logits