stablelm-2-chat

Running

pvduy commited on Apr 7

Commit

53b40bf

•

1 Parent(s): babdb31

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -54,19 +54,17 @@ def predict(message, history, system_prompt, temperature, max_tokens):
     outputs = []
     for text in streamer:
         outputs.append(text)
-        stop = False
-        for tok in stop_tokens:
-            if tok in text:
-                stop = True
-                break
-        if stop:
-            yield "".join(outputs)
             break
 if __name__ == "__main__":
     args = parse_args()
-    tokenizer = AutoTokenizer.from_pretrained("stabilityai/stablelm-2-12b-chat", trust_remote_code=True)
-    model = AutoModelForCausalLM.from_pretrained("stabilityai/stablelm-2-12b-chat", trust_remote_code=True, torch_dtype=torch.bfloat16)
     device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
     model = model.to(device)
     gr.ChatInterface(
@@ -85,4 +83,4 @@ if __name__ == "__main__":
             gr.Slider(100, 2048, 1024, label="Max Tokens"),
         ],
         additional_inputs_accordion_name="Parameters",
-    ).queue().launch()

     outputs = []
     for text in streamer:
         outputs.append(text)
+        if text in stop_tokens:
             break
+        print(text)
+        yield "".join(outputs)
 if __name__ == "__main__":
     args = parse_args()
+    tokenizer = AutoTokenizer.from_pretrained("stabilityai/stablelm-2-chat", trust_remote_code=True)
+    model = AutoModelForCausalLM.from_pretrained("stabilityai/stablelm-2-chat", trust_remote_code=True, torch_dtype=torch.bfloat16)
     device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
     model = model.to(device)
     gr.ChatInterface(
             gr.Slider(100, 2048, 1024, label="Max Tokens"),
         ],
         additional_inputs_accordion_name="Parameters",
+    ).queue().launch()