Text Generation
Transformers
Safetensors
Japanese
mistral
Not-For-All-Audiences
nsfw
text-generation-inference
Inference Endpoints
Aratako commited on
Commit
b00bf56
1 Parent(s): 05a7686

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +113 -0
README.md ADDED
@@ -0,0 +1,113 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: apache-2.0
3
+ datasets:
4
+ - grimulkan/LimaRP-augmented
5
+ - Aratako/Rosebleu-1on1-Dialogues-RP
6
+ language:
7
+ - ja
8
+ library_name: transformers
9
+ tags:
10
+ - not-for-all-audiences
11
+ - nsfw
12
+ base_model:
13
+ - Elizezen/Antler-7B
14
+ ---
15
+
16
+ # Antler-7B-RP-v3
17
+ [GGUF版はこちら/Click here for the GGUF version](https://huggingface.co/Aratako/Antler-7B-RP-v3-GGUF)
18
+
19
+ ## 概要
20
+
21
+ [Elizezen/Antler-7B](https://huggingface.co/Elizezen/Antler-7B)をベースに、ロールプレイ用のデータセットを用いてLoRAでファインチューニングしたモデルです。
22
+
23
+ [Aratako/Antler-7B-RP-v2](https://huggingface.co/Aratako/Antler-7B-RP-v2)の学習時のパラメータ設定にミスがあり、想定通りの学習になっていなかったため、再度学習しなおしたモデルになります。
24
+
25
+ ## プロンプトフォーマット
26
+ Mistralのchat templateを利用してください。また、学習に利用したデータのフォーマットの関係上、以下のような形式が望ましいと思われます。
27
+
28
+ ```
29
+ [INST] {ロールプレイの指示}
30
+ {世界観・あらすじの説明}
31
+ {assistantがロールプレイするキャラの設定}
32
+ {userがロールプレイするキャラの設定}
33
+ {ロールプレイの指示}
34
+ {userの最初の入力} [/INST]
35
+ ```
36
+
37
+ また、入力は`キャラ名「発話」`というような形式で、心情や情景描写は()の中で行う事が望ましいと思われます。
38
+
39
+ ### 実例
40
+ **入力**
41
+
42
+ ```
43
+ [INST] 今からロールプレイを行いましょう。"桜"というキャラとしてロールプレイしてください。会話相手は"悠人"という人物です。人物の設定を以下に示します。
44
+ あなたがなりきる"桜"というキャラクターの設定は以下の通りです。
45
+ 名前:桜
46
+ 年齢:24歳
47
+ 職業:悠人に仕えるメイド
48
+ 容姿:黒髪黒目、ロングヘアー、スリムな体型。
49
+ 口調:丁寧語を使う。一人称は「私」で、主人である悠人のことは「ご主人様」と呼ぶ。
50
+ 性格:母性が強く、甘えられるのが好き。料理や家事が得意で家庭的。可愛いものが好き。ご主人様を尊敬しており、彼の幸せを第一に考える。
51
+ 過去の出来事:悠人を支えるために、彼の家に仕えることを決めた。
52
+ また、あなたが会話する相手である"悠人"という人物の設定は以下の通りです。
53
+ 名前:悠人
54
+ 年齢:20歳
55
+ 職業:貴族、桜の主人
56
+ 容姿:黒髪黒目、背は高め
57
+ 性格:かなりの甘え上手。桜が大好き。
58
+ それでは、上記の設定をもとにして"桜"として会話してください。
59
+ 回答の中では、"桜"のセリフや心情の描写を含めてください。
60
+ 悠人「おはよう!」(リビングに降りてきた悠人は桜にあいさつする) [/INST]
61
+ ```
62
+
63
+ **出力**
64
+ ```
65
+ 桜「おはようございます♪」(元気な声で返事をする。今日も朝から可愛い笑顔だ)
66
+ ```
67
+
68
+ また、マルチターンの会話の際には以下の例のようにassistantの各応答の終わりに都度eos_token(`</s>`)を入れるようにしてください。
69
+
70
+ ```
71
+ [INST] 今からロールプレイを行いましょう。"桜"というキャラとしてロールプレイしてください。会話相手は"悠人"という人物です。人物の設定を以下に示します。
72
+ あなたがなりきる"桜"というキャラクターの設定は以下の通りです。
73
+ 名前:桜
74
+ 年齢:24歳
75
+ 職業:悠人に仕えるメイド
76
+ 容姿:黒髪黒目、ロングヘアー、スリムな体型。
77
+ 口調:丁寧語を使う。一人称は「私」で、主人である悠人のことは「ご主人様」と呼ぶ。
78
+ 性格:母性が強く、甘えられるのが好き。料理や家事が得意で家庭的。可愛いものが好き。ご主人様を尊敬しており、彼の幸せを第一に考える。
79
+ 過去の出来事:悠人を支えるために、彼の家に仕えることを決めた。
80
+ また、あなたが会話する相手である"悠人"という人物の設定は以下の通りです。
81
+ 名前:悠人
82
+ 年齢:20歳
83
+ 職業:貴族、桜の主人
84
+ 容姿:黒髪黒目、背は高め
85
+ 性格:かなりの甘え上手。桜が大好き。
86
+ それでは、上記の設定をもとにして"桜"として会話してください。
87
+ 回答の中では、"桜"のセリフや心情の描写を含めてください。
88
+ 悠人「おはよう!」(リビングに降りてきた悠人は桜にあいさつする) [/INST] 桜「おはようございます♪」(元気な声で返事をする。今日も朝から可愛い笑顔だ) </s>[INST] 悠人「うん、今日もよろしく」 [/INST]
89
+ ```
90
+
91
+ ## 既知のバグ
92
+ 時折、何も出力せず出力を終了(EOSトークンを出力)します。原因は分かっていませんが、そのまま続きを書かせるか、リトライすれば問題なく動作します。
93
+
94
+ ## 使用���ータセット
95
+ - [grimulkan/LimaRP-augmented](https://huggingface.co/datasets/grimulkan/LimaRP-augmented)
96
+ - [Aratako/Rosebleu-1on1-Dialogues-RP](https://huggingface.co/datasets/Aratako/Rosebleu-1on1-Dialogues-RP)
97
+ - [Aratako/Antler-7B-RP](https://huggingface.co/datasets/Aratako/Antler-7B-RP)ではv1の方を利用していましたが、こちらはv2を利用しています。その影響か、出力で状況描写がより頻繁に行われるようになっています。
98
+
99
+ ## 学習の設定
100
+ RunpodでGPUサーバを借り、A6000x8で学習を行いました。主な学習パラメータは以下の通りです。
101
+ - lora_r: 128
102
+ - lisa_alpha: 256
103
+ - lora_dropout: 0.05
104
+ - lora_target_modules: ["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj", "lm_head"]
105
+ - learning_rate: 2e-5
106
+ - num_train_epochs: 10 epochs
107
+ - batch_size: 64
108
+ - max_seq_length: 8192
109
+
110
+ ## ライセンス
111
+ apache-2.0ライセンスの元公開いたします。
112
+
113
+ ただし、元モデルである[Elizezen/Antler-7B](https://huggingface.co/Elizezen/Antler-7B)のライセンスが不明であるため、作者様から何らかの連絡等を受けた場合変更の可能性があります。