GPT-SoVITS-JP-ProsodyControl

简介

GPT-SoVITS-JP-ProsodyControl是一个基于GPT-SoVITS预训练模型的扩展，专门为实现更精细的日语音高控制而设计。通过在预训练模型中引入两个新的符号[和]，在200小时的日语数据上进一步微调了8个epoch，使其能够在一定程度上通过调整[和]符号来修正音高。

注意事项

由于模型主要针对日语数据进行微调，其对英语和中文的处理能力相对较弱。

使用示例

以下是一个音高修复的示例：

原始文本： サトノダイヤモンド
原始发音（无音高标注模型）: s a t o n o d a i y a m o N d o
OpenJTalk默认标注: s a ] t o UNK n o UNK d a [ i y a m o ] N d o
手动调整后的发音: s a [ t o UNK n o UNK d a [ i y a m o ] N d o