学位論文 コンテクスト検索エンジンの構築とデータリソース間関係性発見への適用に関する研究

桑折, 章吾

pp.1 - 75 , 2016-03-25
内容記述
本論文では,動向に関する問いを対象としたコンテクスト検索エンジンを構築し,データリソース間関係性発見へ適用し,その有用性について考察する.近年,Web上ではソーシャルメディアの普及に伴い,リアルタイムな情報が世界中の多くのユーザによって投稿,共有されている.そのようなリアルタイムの情報が注目される一方で,Web上には膨大な量のデータが蓄積され,過去の情報を知るためのリソースとしてWebを活用していくことも検討すべきであると考える.しかし,現在の検索エンジンはキーワードベースの検索要求指定,ページ単位での結果出力といった単純な機能にとどまったままであり,利用者の情報検索要求との乖離が大きいという問題がある.このような問題に対して,検索対象とするドメインを限定することによって情報検索の効率化を図るというアプローチも可能であるが,既存の検索エンジンが広く一般的に普及している理由の1つとして,ドメインを限定しないという点が挙げられる.そこで本論文では,「動向に関する問い」という,ドメインに依存しないタスクを対象とした検索をコンテクスト検索と定義し,このタスクに特化した,既存検索エンジンよりも高度な基本検索機能を提供する次世代検索エンジンを構築する.また,オープンデータ,IoTによるビッグデータはデータ同士の組み合わせによって価値を創造することが重要とされているが,それらのデータは動向情報を伴う事が多い.そこで,コンテクスト検索エンジンの活用が期待される分野として,動向に基づくリソース間関係発見タスクに着目し,このタスクにおけるコンテクスト検索エンジンの有用性について考察する.本論文で構築するコンテクスト検索エンジンでは,検索対象とする動向情報を2種類に大別している.1つ目は各アイテムの価格や販売量に関する統計データのような,各企業や組織・団体によりコンテンツとして公開される動向情報である「Webコンテンツとしての動向データ」である.2つ目は各アイテムをキーワードとして既存検索エンジンで検索した際のヒット数や,プログ記事数などといった,Web上でのユーザ活動により発生する動向情報である「Web利用としての動向データ」である.特徴的な変動タイプとして最大値,最小値,急上昇,急下降,ピーク,底の6種類を検索対象とし,基本検索機能として「指定したアイテムに関する動向が特徴的変動を示した期間の検索」,「指定した期間に特徴的変動を示したアイテム・動向の検索」,「指定したアイテムに関する動向が特徴的変動を示した期間に同様の変動を示したアイテム・動向の検索」を提供する.コンテクスト検索エンジンではこれらの変動タイプ,基本検索機能を多様に組み合わせることによって高度な検索を可能とする.本論文は5章から構成される.1章では,本論文における研究背景及び,研究目的について記述する.2章では検索対象ドメインを限定することによって,次世代検索エンジンとして検索の効率化を図る関連研究についてまとめる.3章では,提案するコンテクスト検索エンジンの構成や,Web上の動向情報の概要,システムの機能,インタフェースについて記述する.4章では,既存検索エンジンを用いた場合の情報検索行動を分析するために行った実験について述べ,観測されたユーザの検索意図を分類する体系を提案する.得られた分類体系に基づき,コンテクスト検索エンジンにおいて想定される検索意図と基本検索機能の対応についても考察する,さらに,国内・海外で行った,提案システムを用いたデータリソース間関係性発見に関するユーザ実験の結果についても示す.実験では,実験協力者にアイテム名を与え,そのアイテムと関係があるアイテムをコンテクスト検索エンジンを用いて発見してもらった.その後,既存検索エンジンを用いてニュース記事,SNS,ブログ等に記述されている,2つのアイテムが関係している理由を発見してもらった.実験結果より,ユーザは様々な検索意図に基づき,コンテクスト検索エンジンが提供する基本検索機能を組み合わせ,アイテム間の関係を発見していることを示す.5章では,本論文で提案したシステムの有用性についてまとめるとともに,今後の展望について述べる.
This thesis aims to develop of a context search engine and apply it to the task for finding relation between data resources. About 25 years have already passed since the Web became popular all over the world and huge amount of information has been accumulated. Therefore, we should make effective use of the Web as resource for knowing information about past events and trends as well. The context search engine focuses on trend-related queries, and it is expected to be useful in various domains because trend-related queries are domain-independent. The prototype system collects various trend-information from the Web and provides three basic functions. As the way of using the context search engine effectively, this thesis verifies its practical use for finding relation between data resources by user experiments.
首都大学東京, 2016-03-25, 修士(工学)
本文を読む

https://tokyo-metro-u.repo.nii.ac.jp/?action=repository_action_common_download&item_id=6517&item_no=1&attribute_id=18&file_no=1

このアイテムのアクセス数:  回

その他の情報