jinaai
/

xlm-roberta-flash-implementation

koukandre commited on Apr 17

Commit

4f2b80b

•

1 Parent(s): f0925f9

Update modeling_xlm_roberta_for_glue.py

Files changed (1) hide show

modeling_xlm_roberta_for_glue.py CHANGED Viewed

@@ -6,16 +6,16 @@ from torch.nn import CrossEntropyLoss, MSELoss, BCEWithLogitsLoss
 from transformers.modeling_outputs import SequenceClassifierOutput, QuestionAnsweringModelOutput, TokenClassifierOutput
 from .modeling_bert import XLMRobertaPreTrainedModel, XLMRobertaModel
-from .configuration_bert import JinaBertConfig
 class XLMRobertaForSequenceClassification(XLMRobertaPreTrainedModel):
-    def __init__(self, config: JinaBertConfig):
         super().__init__(config)
         self.num_labels = config.num_labels
         self.config = config
-        self.bert = XLMRobertaModel(config)
         classifier_dropout = (
             config.classifier_dropout
             if config.classifier_dropout is not None
@@ -56,11 +56,16 @@ class XLMRobertaForSequenceClassification(XLMRobertaPreTrainedModel):
         assert output_attentions is None
         assert output_hidden_states is None
         assert return_dict
-        outputs = self.bert(
             input_ids,
             attention_mask=attention_mask,
             token_type_ids=token_type_ids,
             position_ids=position_ids,
         )
         pooled_output = outputs[1]

 from transformers.modeling_outputs import SequenceClassifierOutput, QuestionAnsweringModelOutput, TokenClassifierOutput
 from .modeling_bert import XLMRobertaPreTrainedModel, XLMRobertaModel
+from .configuration_xlm_roberta import XLMRobertaFlashConfig
 class XLMRobertaForSequenceClassification(XLMRobertaPreTrainedModel):
+    def __init__(self, config: XLMRobertaFlashConfig):
         super().__init__(config)
         self.num_labels = config.num_labels
         self.config = config
+        self.roberta = XLMRobertaModel(config)
         classifier_dropout = (
             config.classifier_dropout
             if config.classifier_dropout is not None
         assert output_attentions is None
         assert output_hidden_states is None
         assert return_dict
+        outputs = self.roberta(
             input_ids,
             attention_mask=attention_mask,
             token_type_ids=token_type_ids,
             position_ids=position_ids,
+            head_mask=head_mask,
+            inputs_embeds=inputs_embeds,
+            output_attentions=output_attentions,
+            output_hidden_states=output_hidden_states,
+            return_dict=return_dict,
         )
         pooled_output = outputs[1]