Journal Article ツイート投稿位置推定のための単語フィルタリング手法

森國, 泰平  ,  吉田, 光男  ,  岡部, 正幸  ,  梅村, 恭司

ツイートに含まれる特徴と位置情報を対応させることで,実世界を観測するセンサとしてTwitterを活用することができる.しかし位置情報が付加されたツイートは少なく,Twitterをセンサとして活用するときの問題の1つとなる.そこで本研究では,ツイートの投稿位置を推定し,より多くのツイートに正確な位置情報を付与することを目的とする.この目的を達成するために,ツイート中のノイズとなる単語を除去するためのフィルタリング手法を提案する.また,単語の地理的分布を平滑化するためのスムージング手法も提案する.これらの提案手法が従来手法よりも有効に機能することを示し,その考察を行う.Twitter can be considered as a real-time sensor that responds to real-world events by combining the content and location information of tweets. However, a problem persists: tweets containing location information are too small. To overcome this problem, we estimate the location where a tweet was posted. Our main method involves using word filters called AF filter and TF-IAF filter that detect stop words. In addition, we propose a smoothing method called Distance smoothing for overcoming sparsity of words. We show that both our methods improve location estimation accuracy and discuss the features of the results.

