Conference Paper 複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善

岩野, 公司  ,  Iwano, Koji  ,  荒毛, 祐紀  ,  ARAKE, Yuki  ,  小平, 優希  ,  KODAIRA, Yuki  ,  篠田, 浩一  ,  Shinoda, Koichi

116 ( no. 189 )  , pp.53 - 58 , 2016-08 , The Institute of Electronics, Information and Communication Engineers , 一般社団法人 電子情報通信学会
Description
本稿では,会話や会議の参加者が各自の所有するスマートフォンで音声を収録することで集められた,複数の多人数会話音声の処理技術として,「対話グループ検出」と「話者決定」について論じる.先行研究で提案した対話グループ検出は,グループ数が既知であることを前提とした手法であったため,本研究ではその改善手法として,BIC基準に基づくグループ数推定機能を有する対話グループ検出手法の提案を行う.また,クラスタリング手法の改良による性能改善も試みる.話者決定については,従来の提案手法では性能が 6 割に満たなかったため,相互スペクトル減算によって発話重畳の影響を抑制した話者決定手法の提案を行い,性能の向上を試みる.対話グループ検出については,15 グループ60 会話音声データを使用した実験の結果,正しくグループ数が推定され,グ ループ検出性能も100%に達することが確認された.話者決定手法については,5 セッションの雑談音声データを利 用した評価により,従来手法よりも約6%の性能改善が確認され,提案手法の有効性が示された.

Number of accesses :  

Other information