litagin commited on
Commit
291528b
1 Parent(s): d3c5856

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +14 -15
README.md CHANGED
@@ -1,16 +1,16 @@
1
- # Style-Bert-VITS2 小春音アミ(CV: あみたろ)モデル
2
 
3
- - [あみたろの声素材工房](https://amitaro.net/)で公開されているコーパス音源を利用して学習した、Style-Bert-VITS2のモデルです(ver 2.5.0で学習)
4
- - スタイルは次の6スタイル: Neutral(デフォルト、平均スタイル)・るんるん・ささやきA(無声ささやき)・ささやきB(有声ささやき)・よふかし・ノーマル
5
- - スタイルの強さに関して敏感なモデルなので、強さは1くらいがよく、大きくしすぎると声が崩壊するので注意ください
6
 
7
  注: このモデルはlitagin個人が提供するものであり、あみたろの声素材工房公式・あみたろ様本人によって学習されたモデルではありません。
8
 
9
  ## 利用規約
10
 
11
- [あみたろの声素材工房様の規約](https://amitaro.net/voice/voice_rule/) と [あみたろのライブ配信音声・利用規約](https://amitaro.net/voice/livevoice/#index_id6) を全て守らなければなりません。特に、以下の事項を遵守してください(規約を守れば商用非商用問わず利用できます):
12
 
13
- #### 禁止事項
14
 
15
  - 年齢制限のある作品・用途への使用
16
  - 新興宗教・政治・マルチ購などに深く関係する作品・用途
@@ -18,14 +18,14 @@
18
  - 生成された音声を、あみたろ本人の声として扱うこと
19
  - 生成された音声を、あみたろ以外の人の声として扱うこと
20
 
21
- #### クレジット表記
22
 
23
  生成音声を公開する際は(媒体は問わない)、必ず分かりやすい場所に `あみたろの声素材工房 (https://amitaro.net/)` を含むクレジット表記を記載してください。
24
 
25
  クレジット表記例:
26
- - `Style-BertVITS2モデル: 小春音アミ、あみたろの声素材工房 (https://amitaro.net/)`
27
 
28
- #### モデルマージ
29
 
30
  モデルマージに関しては、[あみたろの声素材工房のよくある質問への回答](https://amitaro.net/voice/faq/#index_id17)を遵守してください:
31
  - 本モデルを別モデルとマージできるのは、その別モデル作成の際に学習に使われた声の権利者が許諾している場合に限る
@@ -34,10 +34,9 @@
34
 
35
  ## 学習詳細
36
 
37
- - [あみたろのコーパス読み上げ音声一覧](https://amitaro.net/voice/corpus-list/)にて配布されている以下の音声ファイルとそのコーパス文を利用
38
- - ITAコーパス(ノーマル・るんるん・よふかし・ささやきA・ささやきB)
39
- - MANAコーパス(ノーマル・るんるん・よふかし・ささやきA・ささやきB)
40
- - あみたろコーパス(ノーマルスタイルへ使用)
41
- - 合計約2700ファイル2時間半
42
- - バッチサイズ3にて100エポック学習し、比較して良さげな途中の60エポック54kステップのものを使用
43
 
 
1
+ # Style-Bert-VITS2 あみたろモデル
2
 
3
+ - [あみたろの声素材工房](https://amitaro.net/)の[あみたろのライブ配信音声](https://amitaro.net/voice/livevoice/)で公開されているライブ配信音声を利用して学習した、Style-Bert-VITS2のモデルです(ver 2.5.0で学習)
4
+ - あみたろ様には事前に許可を得て学習して、公開の許可も頂いております
5
+ - スタイルは次の配布時のシリーズ01 ~ 04に応じた4スタイルです
6
 
7
  注: このモデルはlitagin個人が提供するものであり、あみたろの声素材工房公式・あみたろ様本人によって学習されたモデルではありません。
8
 
9
  ## 利用規約
10
 
11
+ [あみたろの声素材工房様の規約](https://amitaro.net/voice/voice_rule/) と [あみたろのライブ配信音声・利用規約](https://amitaro.net/voice/livevoice/#index_id6) を全て守らなければなりません。特に、以下の事項を遵守してください(規約を守れば商用非商用問わず利用できます)。
12
 
13
+ ### 禁止事項
14
 
15
  - 年齢制限のある作品・用途への使用
16
  - 新興宗教・政治・マルチ購などに深く関係する作品・用途
 
18
  - 生成された音声を、あみたろ本人の声として扱うこと
19
  - 生成された音声を、あみたろ以外の人の声として扱うこと
20
 
21
+ ### クレジット表記
22
 
23
  生成音声を公開する際は(媒体は問わない)、必ず分かりやすい場所に `あみたろの声素材工房 (https://amitaro.net/)` を含むクレジット表記を記載してください。
24
 
25
  クレジット表記例:
26
+ - `Style-BertVITS2モデル: あみたろ、あみたろの声素材工房 (https://amitaro.net/)`
27
 
28
+ ### モデルマージ
29
 
30
  モデルマージに関しては、[あみたろの声素材工房のよくある質問への回答](https://amitaro.net/voice/faq/#index_id17)を遵守してください:
31
  - 本モデルを別モデルとマージできるのは、その別モデル作成の際に学習に使われた声の権利者が許諾している場合に限る
 
34
 
35
  ## 学習詳細
36
 
37
+ - 学習元は[あみたろのライブ配信音声](https://amitaro.net/voice/livevoice/)にて配布されている音声ファイル
38
+ - SBV2の内蔵のスライス・書き起こしツールでデータセットを作成(手動ノイズ除去や書き起こし修正はしていません)
39
+ - 合計約1万ファイル18時間程度
40
+ - 配信音声のうち01シリーズがかなりの割合をしめ、疑問文やつぶやき多めのため、影響を少し抑えるため、最初の50kステップ程度までは01-04で、その後は01を除いた02-04のファイルで学習
41
+ - バッチサイズ4にて100エポック161kステップまで学習し、そこからよさそうな46エポック87kステップを選択
 
42