会議発表論文 クラスタリングによる利用者投稿動画の偏在性分析

佐嘉田, 悠樹  ,  伊東, 栄典

2018-03-05 , 電子情報通信学会 データ工学研究専門委員会
内容記述
動画や小説,画像などのコンテンツを投稿するサービス(CGM, Consumer Generated Media) が人気である。近年CGM サイトへの投稿コンテンツの画一化への懸念がある。多様性が減少し画一化が進むと文化的な活力も減り,サイト経営にも問題になる。我々はニコニコ動画を対象に,動画の多様性動向について分析している。今回,動画のメタデータにクラスタリングを適用し,クラスタのサイズ等から動画集合の多様性について分析した。動画をクラスタリングするには,動画をベクトルで表現する必要がある。動画にはタイトル,説明文,視聴者が付与するタグが付随しているものの,これらの文字は重要情報ではあるものの,情報量が少なくまた単語のゆらぎも大きい。そこで,辞書であるニコニコ大百科等を利用して,動画ベクトル化する。ニコニコ大百科の説明ページから,Doc2Vec で見出し語を,Word2Vec で各単語をベクトル化した。単語のベクトルデータを用いて,各動画をベクトルで表現した。次に動画ベクトルの集合を分割X-means でクラスラリングした。その後,各クラスタのサイズなどを分析することで,投稿動画の多様性を分析した,ベクトル化,クラスタリングの結果,および多様性動向の分析結果について報告する。
本文を読む

https://catalog.lib.kyushu-u.ac.jp/opac_download_md/1912138/22.pdf

このアイテムのアクセス数:  回

その他の情報