GPT-SoVITS-JP-ProsodyControl
简介
GPT-SoVITS-JP-ProsodyControl是一个基于GPT-SoVITS预训练模型的扩展,专门为实现更精细的日语音高控制而设计。通过在预训练模型中引入两个新的符号[
和]
,在200小时的日语数据上进一步微调了8个epoch,使其能够在一定程度上通过调整[
和]
符号来修正音高。
注意事项
由于模型主要针对日语数据进行微调,其对英语和中文的处理能力相对较弱。
使用示例
以下是一个音高修复的示例:
- 原始文本:
サトノダイヤモンド
- 原始发音(无音高标注模型):
s a t o n o d a i y a m o N d o
- OpenJTalk默认标注:
s a ] t o UNK n o UNK d a [ i y a m o ] N d o
- 手动调整后的发音:
s a [ t o UNK n o UNK d a [ i y a m o ] N d o