Research Paper ヒト発話シミュレータによるStory Teller Systemの構築

赤木, 正人

表現豊かな音声合成システムの実現を目指して,本を読み聞かせるシステムの構築を行う。言うなれば,役で声質を演じわけるコンピュータを実現するプロジェクトである。HMM音声合成などの既存の方法では,学習対象とする大規模音声データベースに依存した音声が合成されるため,様々な役を演じる個性ある音声の合成には,発話スタイルそれぞれに大規模データベースが必要となる。これを打破するために,ヒトの音声生成機構を忠実に反映したヒト発話モデル(発話シミュレータ)を考案する。様々な声質を使い分けられるヒトの音声発話方法を解明し,モデルに組み込むことで,個性ある声の合成への適用を試みる。:Aiming to realize an expressive speech synthesis system, we build a story teller system. In other words, it is a project to realize a computer that plays various roles with their appropriate voice qualities. In existing methods such as HMM speech synthesis, since speech dependent on large-scale speech database to be learned is synthesized, large-scale databases are required to synthesize speech with various speech styles and individualities, in playing various roles. In order to overcome this, we devise a model for human speech production (voice production simulator) that faithfully reflects human speech production mechanism. Elucidating the human speech production method which can selectively use various voice qualities, we try to apply it to the synthesis of individual voice by implementing it into the model.

