Journal Article 音声ドキュメントを検索対象とした用語検索
Automatic Term Retrieval from Spoken Document

森田, 直樹  ,  南條, 浩輝  ,  山本, 凌紀  ,  馬, 青

58 ( 3 )  , pp.762 - 767 , 2017-03-15
ISSN:1882-7764
NCID:AN00116647
Description
動画検索のための音声ドキュメントからの用語検索について述べる.すなわち,検索クエリ(説明文)が何の用語についての説明文であるかの推定を行う.本提案手法は,検索クエリと意味的に類似している音声ドキュメントの一部(パッセージ)に求める用語があると仮定して,パッセージ選択と関連語抽出を行って用語候補とするものである.具体的には,発話の意味や内容によらず機械的に発話の数に基づいた単位をパッセージとして用いることを提案し,その有効性を調査する.本実験では,検索対象の音声ドキュメントとしてCSJの2,702件の講演音声を用いた.実験により,80%以上の用語を用語候補に含められること,および40%程度の用語を用語候補の20位以内に出力でき,提案手法の有効性を確認した.
Term retrieval from spoken document for video search is addressed. We assume that target terms likely occur at some parts of spoken document semantically similar to a given query, and try to find them by selecting passages and extracting related terms based on that assumption. As for passage unit, we propose an automatically divided unit which is just segmented according to the number of utterances. We evaluated the proposed method with 2,702 lecture speeches from Corpus of Spontaneous Japanese, and confirmed that 80% or more terms are found at an output candidate list, and almost 40% terms are listed within top 20.
Full-Text

https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=178586&item_no=1&attribute_id=1&file_no=1

Other information