unography
/

llama-with-feats

Model card Files Files and versions Community

unography commited on 5 days ago

Commit

5eb7d19

•

1 Parent(s): 555a05e

Upload 2 files

Files changed (2) hide show

configuration_llama_lm_feats.py +18 -0
model_llama_lm_feats.py +55 -0

configuration_llama_lm_feats.py ADDED Viewed

	@@ -0,0 +1,18 @@

+from transformers import LlamaConfig
+class LlamaWithFeatsEncoderConfig(LlamaConfig):
+    model_type = "llama_with_feats_encoder"
+    def __init__(self, feats_hidden_size=8, **kwargs):
+        super().__init__(**kwargs)
+        self.feats_hidden_size = feats_hidden_size
+    def to_dict(self):
+        """
+        Serializes this instance to a Python dictionary.
+        """
+        output = super().to_dict()
+        output["model_type"] = self.model_type
+        output["feats_hidden_size"] = self.feats_hidden_size
+        return output

model_llama_lm_feats.py ADDED Viewed

	@@ -0,0 +1,55 @@

+import torch.nn as nn
+from transformers import LlamaForCausalLM
+from transformers.models.llama.modeling_llama import LlamaMLP
+from .configuration_llama_lm_feats import LlamaWithFeatsEncoderConfig
+class LlamaFeatsMLP(LlamaMLP):
+    def __init__(self, config):
+        super().__init__(config)
+        self.gate_proj = nn.Linear(config.feats_hidden_size, self.intermediate_size, bias=False)
+        self.up_proj = nn.Linear(config.feats_hidden_size, self.intermediate_size, bias=False)
+class LlamaWithFeatsForCausalLM(LlamaForCausalLM):
+    config_class = LlamaWithFeatsEncoderConfig
+    def __init__(self, config: LlamaWithFeatsEncoderConfig):
+        super().__init__(config)
+        self.feature_mlp = LlamaFeatsMLP(config)
+        self.post_init()
+    def forward(
+        self,
+        input_ids=None,
+        attention_mask=None,
+        meta_features=None,
+        position_ids=None,
+        past_key_values=None,
+        inputs_embeds=None,
+        labels=None,
+        use_cache=None,
+        output_attentions=None,
+        output_hidden_states=None,
+        return_dict=None,
+    ):
+        if inputs_embeds is None:
+            inputs_embeds = self.model.embed_tokens(input_ids)
+        if meta_features is not None:
+            feats_embeds = self.feature_mlp(meta_features)
+            inputs_embeds = inputs_embeds + feats_embeds
+        return super().forward(
+            attention_mask=attention_mask,
+            position_ids=position_ids,
+            past_key_values=past_key_values,
+            inputs_embeds=inputs_embeds,
+            labels=labels,
+            use_cache=use_cache,
+            output_attentions=output_attentions,
+            output_hidden_states=output_hidden_states,
+            return_dict=return_dict,
+        )