Spaces:

RamAnanth1
/

Dolly-v2

Sleeping

RamAnanth1 commited on Feb 28

Commit

d6d59d4

•

1 Parent(s): 11b4644

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,7 +4,7 @@ import gradio as gr
 from gradio.themes.base import Base
 from gradio.themes.utils import colors, fonts, sizes
 from instruct_pipeline import InstructionTextGenerationPipeline
-from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
 import torch
@@ -17,7 +17,9 @@ theme = gr.themes.Monochrome(
 )
 tokenizer = AutoTokenizer.from_pretrained("databricks/dolly-v2-12b", padding_side="left")
-model = AutoModelForCausalLM.from_pretrained("databricks/dolly-v2-12b", device_map="auto", load_in_8bit=True)
 generate_text = InstructionTextGenerationPipeline(model=model, tokenizer=tokenizer)

 from gradio.themes.base import Base
 from gradio.themes.utils import colors, fonts, sizes
 from instruct_pipeline import InstructionTextGenerationPipeline
+from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline, BitsAndBytesConfig
 import torch
 )
 tokenizer = AutoTokenizer.from_pretrained("databricks/dolly-v2-12b", padding_side="left")
+quantization_config = BitsAndBytesConfig(load_in_8bit=True,
+                                         llm_int8_threshold=200.0)
+model = AutoModelForCausalLM.from_pretrained("databricks/dolly-v2-12b", device_map="auto", quantization_config=quantization_config)
 generate_text = InstructionTextGenerationPipeline(model=model, tokenizer=tokenizer)