README / README.md
sakuraumi's picture
Update README.md
2ac37af
|
raw
history blame
3.11 kB
metadata
title: README
emoji: 🌖
colorFrom: green
colorTo: pink
sdk: static
pinned: false

Sakura-13B-Galgame

🦉 GitHub | 🤖 ModelScope

介绍

基于LLaMA2-13B,OpenBuddy(v0.1-v0.4),Baichuan2-13B(v0.5,v0.8)和Qwen-14B(v0.7)构建,在Galgame中日文本数据上进行微调,旨在提供性能接近GPT3.5且完全离线的Galgame/轻小说翻译大语言模型. 新建了TG交流群,欢迎交流讨论。

网站:轻小说机翻机器人已接入Sakura模型(v0.8-4bit),站内有大量模型翻译结果可供参考。

轻小说机翻机器人网站是一个自动生成轻小说机翻并分享的网站。你可以浏览日文网络小说,或者上传Epub/Txt文件,并生成机翻。

模型下载:

版本 全量模型 8-bit量化 4-bit量化 3-bit量化
20230827-v0.1 🤗 Sakura-13B-Galgame-v0.1 - - -
20230908-v0.4 🤗 Sakura-13B-Galgame-v0.4 - - -
20230917-v0.5 🤗 Sakura-13B-Galgame-v0.5 🤗 Sakura-13B-Galgame-v0.5-8bits 🤗 Sakura-13B-Galgame-v0.5-4bits -
20231011-v0.7 🤗 Kisara-14B-LNovel - - -
20231026-v0.8 🤗 Sakura-13B-LNovel-v0.8 🤗 Sakura-13B-LNovel-v0.8-8bit 🤗 Sakura-13B-LNovel-v0.8-4bit 🤗 Sakura-13B-LNovel-v0.8-3bit

目前仍为实验版本,翻译质量较差.

显存需求

使用v0.8版本进行测试,模型生成参数与仓库中generation_config.json一致,显存占用数据取自nvidia-smi

模型量化类型 载入显存 推理显存(ctx约600) 推理显存(ctx约1800)
全量 超出游戏显卡显存范围 - -
8bit 17G 21.1G 23.4G
4bit 11.3G 14.9G 17.4G
3bit 9.7G 13.7G 15.5G

快速开始

详见SakuraLLM/TranslationScript

更多信息

详情请查看此页面