Spaces:

mobinln
/

chatbot

Running

mobinln commited on Aug 8

Commit

fca7347

•

1 Parent(s): 8926d1f

change settings

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,9 +4,9 @@ from llama_cpp import Llama
 model = "Qwen/Qwen2-7B-Instruct-GGUF"
 llm = Llama.from_pretrained(
     repo_id=model,
-    filename="qwen2-7b-instruct-q4_k_m.gguf",
     verbose=True,
-    use_mmap=False,
     use_mlock=True,
     n_threads=2,
     n_threads_batch=2,
@@ -39,6 +39,7 @@ def respond(
         stream=True,
         temperature=temperature,
         top_p=top_p,
     )
     for message in completion:

 model = "Qwen/Qwen2-7B-Instruct-GGUF"
 llm = Llama.from_pretrained(
     repo_id=model,
+    filename="qwen2-7b-instruct-q4_0.gguf",
     verbose=True,
+    use_mmap=True,
     use_mlock=True,
     n_threads=2,
     n_threads_batch=2,
         stream=True,
         temperature=temperature,
         top_p=top_p,
+        echo=False
     )
     for message in completion: