Update README.md
Browse files
README.md
CHANGED
@@ -36,4 +36,15 @@ pinned: false
|
|
36 |
|
37 |
~~lsp们最关注的翻译R18轻小说的效果:使用[这本r18小说](https://novel18.syosetu.com/n2975ig)的部分文本,比较各版本输出文本(其中GPT网页端和API均无法翻译),结果已上传至[链接](https://huggingface.co/sakuraumi/Sakura-13B-Galgame-Archived/blob/main/r18_test.txt)~~
|
38 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
39 |
详情请查看[此页面](https://huggingface.co/sakuraumi/Sakura-13B-Galgame)
|
|
|
36 |
|
37 |
~~lsp们最关注的翻译R18轻小说的效果:使用[这本r18小说](https://novel18.syosetu.com/n2975ig)的部分文本,比较各版本输出文本(其中GPT网页端和API均无法翻译),结果已上传至[链接](https://huggingface.co/sakuraumi/Sakura-13B-Galgame-Archived/blob/main/r18_test.txt)~~
|
38 |
|
39 |
+
# 显存需求(尚未完成)
|
40 |
+
|
41 |
+
使用v0.8版本进行测试,模型生成参数与仓库中`generation_config.json`一致,显存占用数据取自`nvidia-smi`
|
42 |
+
|
43 |
+
| 模型量化类型 | 载入显存 | 推理显存(ctx约600) | 推理显存(ctx约1800) |
|
44 |
+
|:-------:|:-------:|:-------:|:-------:|
|
45 |
+
| 全量 | 超出游戏显卡显存范围 | - | - |
|
46 |
+
| 8bit | - | - | - |
|
47 |
+
| 4bit | - | 14.9G | 17.4G |
|
48 |
+
| 3bit | - | - | - |
|
49 |
+
|
50 |
详情请查看[此页面](https://huggingface.co/sakuraumi/Sakura-13B-Galgame)
|