学位論文 価値観モデルベース協調フィルタリングのユーザ特性解析による推薦性能向上に関する研究

三澤, 遼理

pp.1 - 80 , 2016-03-25
内容記述
本論文では,価値観に基づくユーザモデルを協調フィルタリング(Collaborative Filtering,CF)の類似ユーザ計算に利用する,価値観ベースCFの推薦性能向上を目的として,ユーザ特性を考慮した拡張推薦手法を提案する.近年,Amazonに代表される通販サイトや飲食店,宿泊施設のレビューサイトが広く利用されている.このようなWebサイトが取り扱うアイテム数,サイトを利用するユーザ数は膨大なものとなっており,サイト上でユーザに対して有用な情報やアイテムを提示し意思決定を支援することは,ユーザとWebサイト運営者の両者にとって有益である.有用な情報やアイテムを提示するために,情報推薦システムが情報フィルタリングの一手法として広く利用されている.情報推薦システムの代表的な手法として,CFが挙げられる.CFはアイテムの性質を考慮せず,ユーザが共通に評価したアイテムに基づきユーザ間の嗜好の類似性を計算し,推薦を行う手法である.アイテムの詳細な情報を必要としないことや,実装が容易であるにも関わらず特性が良好であることから広く用いられている.しかし,CFには新規ユーザ,アイテムに対するシステムの利用履歴が少ない場合に推薦精度が低くなってしまうcold-start問題や,ユーザの付与した評価の数が取り扱うアイテムの数に対して少なすぎる場合に推薦精度が低くなってしまうsparsity問題が存在する.他にも,低評価や高評価など極端な評価を得ているアイテムに対する予測精度が低下する問題も指摘されている.これらの問題に対して,価値観をアイテムの属性に対するこだわりの強さと定義して,これをモデリングした価値観に基づくユーザモデルが提案されている.価値観ベースCFでは価値観に基づくユーザモデルをユーザ間の類似度計算に利用することにより,推薦可能ユーザ数の増加,低い評価値が付与されている場合の予測精度の向上などの結果が得られている.しかし,データセットによっては予測精度が低下するといった問題があり,価値観ベースCFが有効に働くユーザの発見が課題となっている.価値観に基づくユーザモデルはユーザのこだわりの強さをモデリングする手法であるため,ユーザにはこだわりの強いユーザとそうでないユーザが存在すると考えると,ユーザモデルが有効に働くユーザとそうでないユーザが存在すると推測される.この考えに基づき,本論文では価値観ベースCFの課題に対し,ユーザごとに予測精度に差が生じるという仮定を置き,クラスタリングや分類モデル構築によりユーザを特性に応じ分類することで,価値観ベースCFが有効に働くユーザの発見を目指す.クラスタリングによるユーザのグルーピングでは,まず,ユーザモデルに対してk-means法を用いてクラスタリングを行い,各クラスタのユーザモデルの平均値と標準偏差,ユーザの平均絶対誤差の代表値を基に有効なユーザの判断基準を決定する.次に,その基準に基づき,価値観ベースCFの効果が期待できるユーザへの推薦を試みる.分類モデル構築によるユーザの分類では,各ユーザのユーザモデルを説明属性,平均絶対誤差を目的属性として構築した分類器を用いて,推薦対象のユーザが価値観ベースCFに適しているかどうかを判別する.分類器として,獲得モデルの解釈容易性の観点から決定木を採用している.また,決定木によるユーザの分類を利用して,価値観ベースCFと従来手法であるユーザベースCFを組み合わせたハイブリッド推薦アルゴリズムを提案する.提案手法と従来手法にLeave-one-outを適用し,計算された平均絶対誤差や被覆率の比較によって提案手法の有効性を検討する.また,実験の過程で構築された決定木の構造についても考察する.本論文は5章から構成される.1章では本論文における研究背景及び目的について述べる.2章では,情報推薦システム,情報推薦における価値観,提案手法と関連の強い推薦手法などの関連研究について述べる.3章では,提案手法で利用する価値観ベースCFのアルゴリズムを説明し,クラスタリングによるユーザのグルーピングと分類器によるユーザ分類の具体的な手順および,これらを価値観ベースCFに応用した提案手法のアルゴリズムについて説明する.4章では,データセットを用いた提案手法と従来手法のオフライン評価実験について述べる.評価実験にはフォートラベルや楽天トラベルなどのオンラインWebサイト上に投稿された評価データから構成されるデータセットを利用する.提案手法に対する比較手法として,価値観ベースCF,ユーザベースCF,アイテムの平均評価値を予測評価値とする推薦手法の計3つを利用する.実験では交差確認でデータセットを分割し,Leave-one-out法を用いてテストデータの評価データを1つずつ欠落させ,欠落させたデータに対して各推薦手法で予測評価値を計算するという手順で平均絶対誤差や被覆率を算出し,これらの比較によって提案手法の有用性を検討する.決定木の解析では平均絶対誤差が高いモデルと低いモデルの構造の違いに基づき考察する.5章では,提案手法の概要と従来手法との比較結果についてまとめ,今後の展望について述べる.
This thesis proposes a recommendation method that extends personal value-based collaborative filtering based on user model analysis. Personal value-based collaborative filtering is an extended version of ordinary collaborative filtering, which calculates inter-user similarity based on personal value-based user models. Its effectiveness has been shown by offline experiments. However, its performance depends on the type of users. The proposed method aims to improve its prediction accuracy by identifying users for whom personal-value based approach is effective. Supervised and unsupervised learning are applied to users' personal models to identify such users. Experiments are conducted using actual dataset such as 4Travel and Rakuten Travel, and the effectiveness of the proposed method is evaluated in terms of mean absolute error and coverage.
首都大学東京, 2016-03-25, 修士(工学)
本文を読む

https://tokyo-metro-u.repo.nii.ac.jp/?action=repository_action_common_download&item_id=6541&item_no=1&attribute_id=18&file_no=1

このアイテムのアクセス数:  回

その他の情報