ArthurZ
/

mamba-130m

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

ArthurZ HF staff commited on Feb 16

Commit

c270eb1

•

1 Parent(s): 2da39d0

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -6,12 +6,12 @@ tags: []
 from transformers import MambaConfig, MambaForCausalLM, AutoTokenizer
 import torch
-tokenizer = AutoTokenizer.from_pretrained("ArthurZ/mamba-130m")
 tokenizer.pad_token = tokenizer.eos_token
-model = MambaForCausalLM.from_pretrained("ArthurZ/mamba-130m", vocab_size=50280, num_hidden_layers=24, torch_dtype=torch.float32)
 model.config.use_cache = True
-input_ids = tokenizer("Hey how are you doing?", return_tensors= "pt")["input_ids"]
 out = model.generate(input_ids, max_new_tokens=10)
 print(tokenizer.batch_decode(out))

 from transformers import MambaConfig, MambaForCausalLM, AutoTokenizer
 import torch
+tokenizer = AutoTokenizer.from_pretrained("EleutherAI/gpt-neox-20b", padding_side = "left")
 tokenizer.pad_token = tokenizer.eos_token
+model = MambaForCausalLM.from_pretrained("state-spaces/mamba-130m", vocab_size=50280, num_hidden_layers=24, torch_dtype=torch.float32)
 model.config.use_cache = True
+input_ids = tokenizer(["Hey how are you doing?", "Explain how soy sauce is made"], padding=True, return_tensors= "pt")["input_ids"]
 out = model.generate(input_ids, max_new_tokens=10)
 print(tokenizer.batch_decode(out))