Tevatron
/

dse-phi3-docmatix-v1

Model card Files Files and versions Community

MrLight commited on Jul 24

Commit

63672e5

•

1 Parent(s): e08889c

Update README.md

Files changed (1) hide show

README.md +3 -4

README.md CHANGED Viewed

@@ -22,11 +22,10 @@ The model, `Tevatron/dse-phi3-docmatix-v1.0`, is trained using the `Tevatron/doc
 ```python
 import torch
-from transformers import AutoProcessor, AutoModelForCausalLM, AutoConfig
-processor = AutoProcessor.from_pretrained('microsoft/Phi-3-vision-128k-instruct', trust_remote_code=True)
-config = AutoConfig.from_pretrained('microsoft/Phi-3-vision-128k-instruct', trust_remote_code=True, attn_implementation="flash_attention_2", torch_dtype=torch.bfloat16, use_cache=False)
-model = AutoModelForCausalLM.from_pretrained('Tevatron/dse-phi3-docmatix-v1.0', trust_remote_code=True, config=config, attn_implementation="flash_attention_2", torch_dtype=torch.bfloat16).to('cuda:0')
 def get_embedding(last_hidden_state: torch.Tensor, attention_mask: torch.Tensor) -> torch.Tensor:
     sequence_lengths = attention_mask.sum(dim=1) - 1

 ```python
 import torch
+from transformers import AutoProcessor, AutoModelForCausalLM
+processor = AutoProcessor.from_pretrained('Tevatron/dse-phi3-docmatix-v1.0', trust_remote_code=True)
+model = AutoModelForCausalLM.from_pretrained('Tevatron/dse-phi3-docmatix-v1.0', trust_remote_code=True, attn_implementation="flash_attention_2", torch_dtype=torch.bfloat16, use_cache=False).to('cuda:0')
 def get_embedding(last_hidden_state: torch.Tensor, attention_mask: torch.Tensor) -> torch.Tensor:
     sequence_lengths = attention_mask.sum(dim=1) - 1