Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,113 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
license: apache-2.0
|
3 |
+
datasets:
|
4 |
+
- grimulkan/LimaRP-augmented
|
5 |
+
- Aratako/Rosebleu-1on1-Dialogues-RP
|
6 |
+
language:
|
7 |
+
- ja
|
8 |
+
library_name: transformers
|
9 |
+
tags:
|
10 |
+
- not-for-all-audiences
|
11 |
+
- nsfw
|
12 |
+
base_model:
|
13 |
+
- Elizezen/Antler-7B
|
14 |
+
---
|
15 |
+
|
16 |
+
# Antler-7B-RP-v3
|
17 |
+
[GGUF版はこちら/Click here for the GGUF version](https://huggingface.co/Aratako/Antler-7B-RP-v3-GGUF)
|
18 |
+
|
19 |
+
## 概要
|
20 |
+
|
21 |
+
[Elizezen/Antler-7B](https://huggingface.co/Elizezen/Antler-7B)をベースに、ロールプレイ用のデータセットを用いてLoRAでファインチューニングしたモデルです。
|
22 |
+
|
23 |
+
[Aratako/Antler-7B-RP-v2](https://huggingface.co/Aratako/Antler-7B-RP-v2)の学習時のパラメータ設定にミスがあり、想定通りの学習になっていなかったため、再度学習しなおしたモデルになります。
|
24 |
+
|
25 |
+
## プロンプトフォーマット
|
26 |
+
Mistralのchat templateを利用してください。また、学習に利用したデータのフォーマットの関係上、以下のような形式が望ましいと思われます。
|
27 |
+
|
28 |
+
```
|
29 |
+
[INST] {ロールプレイの指示}
|
30 |
+
{世界観・あらすじの説明}
|
31 |
+
{assistantがロールプレイするキャラの設定}
|
32 |
+
{userがロールプレイするキャラの設定}
|
33 |
+
{ロールプレイの指示}
|
34 |
+
{userの最初の入力} [/INST]
|
35 |
+
```
|
36 |
+
|
37 |
+
また、入力は`キャラ名「発話」`というような形式で、心情や情景描写は()の中で行う事が望ましいと思われます。
|
38 |
+
|
39 |
+
### 実例
|
40 |
+
**入力**
|
41 |
+
|
42 |
+
```
|
43 |
+
[INST] 今からロールプレイを行いましょう。"桜"というキャラとしてロールプレイしてください。会話相手は"悠人"という人物です。人物の設定を以下に示します。
|
44 |
+
あなたがなりきる"桜"というキャラクターの設定は以下の通りです。
|
45 |
+
名前:桜
|
46 |
+
年齢:24歳
|
47 |
+
職業:悠人に仕えるメイド
|
48 |
+
容姿:黒髪黒目、ロングヘアー、スリムな体型。
|
49 |
+
口調:丁寧語を使う。一人称は「私」で、主人である悠人のことは「ご主人様」と呼ぶ。
|
50 |
+
性格:母性が強く、甘えられるのが好き。料理や家事が得意で家庭的。可愛いものが好き。ご主人様を尊敬しており、彼の幸せを第一に考える。
|
51 |
+
過去の出来事:悠人を支えるために、彼の家に仕えることを決めた。
|
52 |
+
また、あなたが会話する相手である"悠人"という人物の設定は以下の通りです。
|
53 |
+
名前:悠人
|
54 |
+
年齢:20歳
|
55 |
+
職業:貴族、桜の主人
|
56 |
+
容姿:黒髪黒目、背は高め
|
57 |
+
性格:かなりの甘え上手。桜が大好き。
|
58 |
+
それでは、上記の設定をもとにして"桜"として会話してください。
|
59 |
+
回答の中では、"桜"のセリフや心情の描写を含めてください。
|
60 |
+
悠人「おはよう!」(リビングに降りてきた悠人は桜にあいさつする) [/INST]
|
61 |
+
```
|
62 |
+
|
63 |
+
**出力**
|
64 |
+
```
|
65 |
+
桜「おはようございます♪」(元気な声で返事をする。今日も朝から可愛い笑顔だ)
|
66 |
+
```
|
67 |
+
|
68 |
+
また、マルチターンの会話の際には以下の例のようにassistantの各応答の終わりに都度eos_token(`</s>`)を入れるようにしてください。
|
69 |
+
|
70 |
+
```
|
71 |
+
[INST] 今からロールプレイを行いましょう。"桜"というキャラとしてロールプレイしてください。会話相手は"悠人"という人物です。人物の設定を以下に示します。
|
72 |
+
あなたがなりきる"桜"というキャラクターの設定は以下の通りです。
|
73 |
+
名前:桜
|
74 |
+
年齢:24歳
|
75 |
+
職業:悠人に仕えるメイド
|
76 |
+
容姿:黒髪黒目、ロングヘアー、スリムな体型。
|
77 |
+
口調:丁寧語を使う。一人称は「私」で、主人である悠人のことは「ご主人様」と呼ぶ。
|
78 |
+
性格:母性が強く、甘えられるのが好き。料理や家事が得意で家庭的。可愛いものが好き。ご主人様を尊敬しており、彼の幸せを第一に考える。
|
79 |
+
過去の出来事:悠人を支えるために、彼の家に仕えることを決めた。
|
80 |
+
また、あなたが会話する相手である"悠人"という人物の設定は以下の通りです。
|
81 |
+
名前:悠人
|
82 |
+
年齢:20歳
|
83 |
+
職業:貴族、桜の主人
|
84 |
+
容姿:黒髪黒目、背は高め
|
85 |
+
性格:かなりの甘え上手。桜が大好き。
|
86 |
+
それでは、上記の設定をもとにして"桜"として会話してください。
|
87 |
+
回答の中では、"桜"のセリフや心情の描写を含めてください。
|
88 |
+
悠人「おはよう!」(リビングに降りてきた悠人は桜にあいさつする) [/INST] 桜「おはようございます♪」(元気な声で返事をする。今日も朝から可愛い笑顔だ) </s>[INST] 悠人「うん、今日もよろしく」 [/INST]
|
89 |
+
```
|
90 |
+
|
91 |
+
## 既知のバグ
|
92 |
+
時折、何も出力せず出力を終了(EOSトークンを出力)します。原因は分かっていませんが、そのまま続きを書かせるか、リトライすれば問題なく動作します。
|
93 |
+
|
94 |
+
## 使用���ータセット
|
95 |
+
- [grimulkan/LimaRP-augmented](https://huggingface.co/datasets/grimulkan/LimaRP-augmented)
|
96 |
+
- [Aratako/Rosebleu-1on1-Dialogues-RP](https://huggingface.co/datasets/Aratako/Rosebleu-1on1-Dialogues-RP)
|
97 |
+
- [Aratako/Antler-7B-RP](https://huggingface.co/datasets/Aratako/Antler-7B-RP)ではv1の方を利用していましたが、こちらはv2を利用しています。その影響か、出力で状況描写がより頻繁に行われるようになっています。
|
98 |
+
|
99 |
+
## 学習の設定
|
100 |
+
RunpodでGPUサーバを借り、A6000x8で学習を行いました。主な学習パラメータは以下の通りです。
|
101 |
+
- lora_r: 128
|
102 |
+
- lisa_alpha: 256
|
103 |
+
- lora_dropout: 0.05
|
104 |
+
- lora_target_modules: ["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj", "lm_head"]
|
105 |
+
- learning_rate: 2e-5
|
106 |
+
- num_train_epochs: 10 epochs
|
107 |
+
- batch_size: 64
|
108 |
+
- max_seq_length: 8192
|
109 |
+
|
110 |
+
## ライセンス
|
111 |
+
apache-2.0ライセンスの元公開いたします。
|
112 |
+
|
113 |
+
ただし、元モデルである[Elizezen/Antler-7B](https://huggingface.co/Elizezen/Antler-7B)のライセンスが不明であるため、作者様から何らかの連絡等を受けた場合変更の可能性があります。
|