テクニカルレポート Moment-matching networkに基づく音声合成における音声パラメータのランダム生成
Random generation of speech parameters in speech synthesis based on moment-matching networks

高道, 慎之介  ,  郡山, 知樹  ,  猿渡, 洋

2017-MUS-115 ( 15 )  , pp.1 - 6 , 2017-06-10
ISSN:2188-8752
NII書誌ID(NCID):AN10438388
内容記述
本稿では,moment-matching network に基づく音声合成における音声パラメータのランダム生成アルゴリズムを提案する.同一の言語情報 ・ パラ言語情報を付与しようとしても,人間は同一の音声を生成することは不可能だが,典型的な統計的音声合成は入力コンテキストに対して完全に同一の音声を生成する.自然音声の発話間変動を合成音声に付与するために,本論文では,音声パラメータのランダムサンプリングを可能にする Deep Neural Network (DNN) 音響モデルを構築する.DNN は合成音声パラメータのモーメントを自然音声パラメータのモーメントに一致させるように学習される.音声パラメータ変動は低次元のシンプルな事前ノイズベクトルに圧縮されるため,音声パラメータの直接的なサンプリングと比較して計算量を抑えたサンプリングが可能となる.実験的評価では,音声パラメータのランダム生成が合成音声品質を劣化させるかについて調査する.評価結果より,最尤生成と比較して提案法による音質低下は生じないことを明らかにする.
本文を読む

https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=182217&item_no=1&attribute_id=1&file_no=1

その他の情報