Spaces:

izumi-lab
/

llama-13b-japanese-lora-v0-1ep

Paused

masanorihirano commited on May 22, 2023

Commit

4f91616

•

1 Parent(s): df97cfa

enable 8bit

Files changed (1) hide show

app.py CHANGED Viewed

@@ -59,31 +59,34 @@ except Exception:
 if device == "cuda":
     model = AutoModelForCausalLM.from_pretrained(
         BASE_MODEL,
-        load_in_8bit=False,
-        torch_dtype=torch.float16,
         device_map="auto",
     )
-    model = PeftModel.from_pretrained(model, LORA_WEIGHTS, torch_dtype=torch.float16)
 elif device == "mps":
     model = AutoModelForCausalLM.from_pretrained(
         BASE_MODEL,
         device_map={"": device},
-        torch_dtype=torch.float16,
     )
     model = PeftModel.from_pretrained(
         model,
         LORA_WEIGHTS,
         device_map={"": device},
-        torch_dtype=torch.float16,
     )
 else:
     model = AutoModelForCausalLM.from_pretrained(
-        BASE_MODEL, device_map={"": device}, low_cpu_mem_usage=True
     )
     model = PeftModel.from_pretrained(
         model,
         LORA_WEIGHTS,
         device_map={"": device},
     )

 if device == "cuda":
     model = AutoModelForCausalLM.from_pretrained(
         BASE_MODEL,
+        load_in_8bit=True,
         device_map="auto",
     )
+    model = PeftModel.from_pretrained(model, LORA_WEIGHTS, load_in_8bit=True)
 elif device == "mps":
     model = AutoModelForCausalLM.from_pretrained(
         BASE_MODEL,
         device_map={"": device},
+        load_in_8bit=True,
     )
     model = PeftModel.from_pretrained(
         model,
         LORA_WEIGHTS,
         device_map={"": device},
+        load_in_8bit=True,
     )
 else:
     model = AutoModelForCausalLM.from_pretrained(
+        BASE_MODEL,
+        device_map={"": device},
+        low_cpu_mem_usage=True,
+        load_in_8bit=True,
     )
     model = PeftModel.from_pretrained(
         model,
         LORA_WEIGHTS,
         device_map={"": device},
+        load_in_8bit=True,
     )