概要
espnet/yodasのja000をWADA SNRを用いて、音声の分析およびSNR値が100以上の音声ファイルのみをまとめたもの
分析結果
分析結果の詳細はaudio_analysis_results.jsonをご確認ください
以下はjsonの内容をヒストグラムにしたものです
以下は分析結果のjsonの構成です
[
{
"ファイル名": "3IZFPbj6Z5c-00116-00045672-00046034",
"SNR値": 11.850106999992533,
"トランスクリプション": "それと僕が材料をお伝えした時にバニラエッセンスを入れたじゃないですか"
},
{
"ファイル名": "3fr1NoJcLzE-00084-00039552-00039962",
"SNR値": 6.813705012877472,
"トランスクリプション": "1弦の5フレット、2弦の5フレット、 3弦の5フレット、2弦の7フレット、"
},
...
]
備考
こちらのデータ分析は「ローカルLLMに向き合う会」が主催するLOCAL AI HACKATHONにてリソースをお借りして処理を行いました