Hugging Face
Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up
Seikaijyu
/
RWKV-x060-World-3B-v2.1-Claude-nsfw.roleplay
like
16
Chinese
Not-For-All-Audiences
License:
mit
Model card
Files
Files and versions
Community
1
Edit model card
模型说明
基于RWKV6-v2.1-3B 全新基模微调的nsfw语C模型
非常感谢
某不知名的神秘网友
提供的784条Claude超长上下文语料(单条长度超过120k),此模型也是基于该语料进行的实验性质微调
使用7k长上下文微调19epoch后loss为1.7得到的模型
因为超长上下文,继续微调应该还能提升效果,暂时只做测试,后续我会进行全面微调,敬请期待
效果如下:
注意:使用该模型需要自定义上文,以下演示回复模型输出的第一句到第二句都为手动定义
神里绫华
补充说明
因为此模型使用纯粹的nsfw多轮对话数据微调,生成会偏向nsfw,这是正常现象
此模型需要手动设定上文才能有良好表现,模型回复会与上文回复类似
推荐如下格式使用模型(不需要设置角色名称,因为让模型以第三人称视角回复效果更好)
推荐参数如下:
Temperature=2-3之间
Top_P=0.55-0.65之间
Presence Penalty=0.4-0之间
Frequency Penalty=0.8-1.2之间
模型说明
基于RWKV6-v2.1-3B 全新基模微调的nsfw语C模型
非常感谢
某不知名的神秘网友
提供的784条Claude超长上下文语料(单条长度超过120k),此模型也是基于该语料进行的实验性质微调
使用7k长上下文微调19epoch后loss为1.7得到的模型
因为超长上下文,继续微调应该还能提升效果,暂时只做测试,后续我会进行全面微调,敬请期待
效果如下:
注意:使用该模型需要自定义上文,以下演示回复模型输出的第一句到第二句都为手动定义
神里绫华
补充说明
因为此模型使用纯粹的nsfw多轮对话数据微调,生成会偏向nsfw,这是正常现象
此模型需要手动设定上文才能有良好表现,模型回复会与上文回复类似
推荐如下格式使用模型(不需要设置角色名称,因为让模型以第三人称视角回复效果更好)
System: User: Assistant:
推荐参数如下:
Temperature=2-3之间
Top_P=0.55-0.65之间
Presence Penalty=0.4-0之间
Frequency Penalty=0.8-1.2之间
Downloads last month
-
Downloads are not tracked for this model.
How to track
Inference API
Unable to determine this model's library. Check the
docs
.
Collection including
Seikaijyu/RWKV-x060-World-3B-v2.1-Claude-nsfw.roleplay
RWKV6 Roleplay
Collection
角色扮演模型
•
4 items
•
Updated
18 days ago
•
1