Thesis or Dissertation 複数類似度尺度の統合によるユーザ適応型時系列データ検索システムに関する研究

伊, 成柱

pp.1 - 41 , 2016-03-25
Description
本論文では,複数の類似度尺度を統合して類似度計算を行う,ユーザ適応型時系列データ検索システムを提案する.時系列データは経済,工学,医療など,さまざまな分野で活用されている.時系列データを活用する要素技術として重要なものに,類似する時系列データの検索がある.これまでに,多様な時系列データの類似度尺度が提案されており,それを用いた時系列データ検索システムが実現されている.しかし,時系列データの類似性に関する判断は,分析目的や分析者の主観的判断に依存する部分も多いため,単一の類似度尺度を利用したのでは,ユーザごとの判断の違いに適応することが困難と考える.そこで本論文では,複数の類似度尺度を統合して類似度計算に用いることにより,この問題の解決を試みる.提案手法では,一つのクエリ(時系列データ)に対して,複数の類似度尺度で他のデータとの距離を計算する.最終的な類似度は,各類似度尺度の線形和により求める.各類似度尺度の重みをユーザ毎に調整することで,ユーザ適応型の時系列データ検索システムを実現する.このとき課題となるのは,重みの調整の方法である.提案システムでは,各尺度で得られた類似度上位のN件を比較し,類似度尺度間でその順序が異なる場合に着目し,ユーザからフィードバックを得ることで重みを調整する.この手法の利点は重みの決定にユーザの判断が反映されることと,反復的に重みを調整する手法などと比較して,効率的に重みを決定可能なことである.プロトタイプシステムを構築してユーザ実験を行い,単一の類似度尺度を用いた場合と比較することで,提案手法の有効性を示す.本論文は5章から構成される.1章では,本論文における研究背景及び研究目的について記述する.2章では,時系列データの類似度尺度の関連研究について記述する.時系列データは様々な分野で活用されており,類似度尺度は,時系列データ検索と時系列データマイニングの基礎である.近年,時系列データの類似度尺度に関する研究が盛んに行われている.その中で代表的な類似度尺度として,ユークリッド距離や,DTW(Dynamic Time Warping)距離などについて,定義および利点・欠点についてまとめる.また,既存の複数の類似度尺度を用いた時系列データ分析手法について述べる.3章では,提案システムの構成について述べる.二つの類似度尺度を使った場合,各類似度尺度を用いてデータベース中の全てのデータとクエリーとの距離を計算する.異なる類似度尺度から求めた距離を統合するために,正規化を行った後,両類似度尺度で求めた上位N件の結果に基づき,重みの調整で可能な全てのランキングを求める.異なるランキング間で同順位にある時系列データを比較していき,異なるデータがランキングされている順位に着目して,どちらのデータがクエリーにより類似しているかをユーザに判定してもらう.この作業を繰り返し,両類似度尺度に対する重みを決定し,検索に利用する.三つ以上の類似度尺度を使った場合,重みの調整で可能なランキングのパターン数が増えるため,ユーザが指定した順序から最適化手法により重みを決定する手法も提案する.4章では,評価実験結果を示す.時系列データ分析システムのプロトタイプシステムを実装し,ユーザ実験を行う.一年間の週次株価データを対象データとし,用意した検索課題に対して実験協力者に検索してもらう.べ一スラインとして,単一の類似度尺度を用いた場合と比較することで,提案手法の有効性について考察する.また,提案する重み調整方法の有効性や効率についても考察する.5章では実験結果と提案システムの有用性についてまとめるとともに,今後の展望について述べる.
This thesis proposes a user-adaptive time series data retrieval system by combining multiple similarity measures. Many distance measures have been proposed as alternatives to the Euclidean distance in the similarity retrieval. Each measure has its merits and demerits. On the other hand. it is known that “correct” distance measure depends upon the user and problem. Therefore this thesis employs an approach of integrating multiple similarity measures with weighted average, and proposes a low cost approach to determine the weights by user's subjective judgment of similarity. The effectiveness of the proposed approach is evaluated by developing a prototype system.
首都大学東京, 2016-03-25, 修士(工学)
Full-Text

https://tokyo-metro-u.repo.nii.ac.jp/?action=repository_action_common_download&item_id=6520&item_no=1&attribute_id=18&file_no=1

Number of accesses :  

Other information