metadata
title: README
emoji: 🌖
colorFrom: green
colorTo: pink
sdk: static
pinned: false
Sakura-13B-Galgame
🦉 GitHub | 🤖 ModelScope
介绍
基于LLaMA2-13B,OpenBuddy(v0.1-v0.4),Baichuan2-13B(v0.5,v0.8)和Qwen-14B(v0.7)构建,在Galgame中日文本数据上进行微调,旨在提供性能接近GPT3.5且完全离线的Galgame/轻小说翻译大语言模型. 新建了TG交流群,欢迎交流讨论。
网站:轻小说机翻机器人已接入Sakura模型(v0.8-4bit),站内有大量模型翻译结果可供参考。
轻小说机翻机器人网站是一个自动生成轻小说机翻并分享的网站。你可以浏览日文网络小说,或者上传Epub/Txt文件,并生成机翻。
模型下载:
版本 | 全量模型 | 8-bit量化 | 4-bit量化 | 3-bit量化 |
---|---|---|---|---|
20230827-v0.1 | 🤗 Sakura-13B-Galgame-v0.1 | - | - | - |
20230908-v0.4 | 🤗 Sakura-13B-Galgame-v0.4 | - | - | - |
20230917-v0.5 | 🤗 Sakura-13B-Galgame-v0.5 | 🤗 Sakura-13B-Galgame-v0.5-8bits | 🤗 Sakura-13B-Galgame-v0.5-4bits | - |
20231011-v0.7 | 🤗 Kisara-14B-LNovel | - | - | - |
20231026-v0.8 | 🤗 Sakura-13B-LNovel-v0.8 | 🤗 Sakura-13B-LNovel-v0.8-8bit | 🤗 Sakura-13B-LNovel-v0.8-4bit | 🤗 Sakura-13B-LNovel-v0.8-3bit |
目前仍为实验版本,翻译质量较差.
显存需求
使用v0.8版本进行测试,模型生成参数与仓库中generation_config.json
一致,显存占用数据取自nvidia-smi
模型量化类型 | 载入显存 | 推理显存(ctx约600) | 推理显存(ctx约1800) |
---|---|---|---|
全量 | 超出游戏显卡显存范围 | - | - |
8bit | 17G | 21.1G | 23.4G |
4bit | 11.3G | 14.9G | 17.4G |
3bit | 9.7G | 13.7G | 15.5G |
快速开始
更多信息
详情请查看此页面