jiangchengchengNLP
/

huatuo-7b-sns8bits

8-bit precision

Model card Files Files and versions Community

jiangchengchengNLP commited on Aug 2

Commit

8d8d65b

•

1 Parent(s): 6384624

Update README.md

Files changed (1) hide show

README.md +15 -0

README.md CHANGED Viewed

@@ -1,16 +1,31 @@
 ---
 license: apache-2.0
 ---
 华佗 GPT2-7B 模型量化版本
 简介
 本项目基于华佗 GPT2-7B 模型，使用 transformers 库中的 bitsandbytes 方法进行了 int8 量化，并将量化后的模型上传到了 Hugging Face 模型库。量化后的模型大小约为 8GB，原模型大小为 26.8GB。该模型可以被 transformers 和 vllm 库加载，并配备了对应的 tokenizer 模型文件。
 模型详情
 基础模型：华佗 GPT2-7B
 量化方法：int8 量化，使用 bitsandbytes 库
 模型大小：量化后约为 8GB，原模型大小为 14GB
 来源：百川模型支持
 使用指南：
 ```
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer

 ---
 license: apache-2.0
 ---
 华佗 GPT2-7B 模型量化版本
 简介
 本项目基于华佗 GPT2-7B 模型，使用 transformers 库中的 bitsandbytes 方法进行了 int8 量化，并将量化后的模型上传到了 Hugging Face 模型库。量化后的模型大小约为 8GB，原模型大小为 26.8GB。该模型可以被 transformers 和 vllm 库加载，并配备了对应的 tokenizer 模型文件。
 模型详情
 基础模型：华佗 GPT2-7B
 量化方法：int8 量化，使用 bitsandbytes 库
 模型大小：量化后约为 8GB，原模型大小为 14GB
 来源：百川模型支持
 使用指南：
+确保你安装了bitsandbytes
+```
+pip install bitsandbytes
+```
 ```
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer