Thesis or Dissertation 写真共有サイトの位置情報付き写真データを利用したテーマ別観光マップの作成

真田, 風

pp.1 - 54 , 2015-03-25
Description
近年観光に対するニーズは多種多様化している。しかし、雑誌などで提供されている観光情報は、多数の旅行者が望む一般的な観光情報であり、多様化する観光ニーズに対応できているとは言い難い。これに対し、CGM(Consumer Generated Media)におけるデータを用いることで、効果的な観光情報が獲得できると考えられる。中でも、Flickrやフォト蔵をはじめとする写真共有サイトの利用拡大や、GPSセンサ搭載携帯デバイスの普及により、位置情報の付いた写真がWeb上に大量にアップロードされており、それらの写真データを活用した観光情報の研究が盛んに行われている。例えば、このような研究の例としてはWeb上の大量の写真を画像分類して提示する観光マップの提案や、写真撮影の位置軌跡を利用した旅程推薦システムの開発、写真群の位置情報を元に人気撮影箇所をヒートマップとして可視化する観光ポテンシャルマップの作成等がある。しかしいずれの研究も、大量の写真データを用いて、大勢の人が注目した場所を見出し、観光情報として提供することを目的としているために、近年の多様化する観光ニーズへの対応は難しい。一方で、一連の観光ポテンシャルマップ研究の中で「写真のタイトルやタグの中身に踏み込み写真を選別する、テーマ別のマップ作成の可能性」が指摘されている。そこで本研究では、観光ポテンシャルマップ研究を土台に、テーマ別観光マップの作成に取り組む。そして、低コストで有用なCGMデータを用いた、テーマ別観光マップ作成の方法論を導き出すことを目的とする。テーマ別観光マップを作成するにあたり、まずはどのようなテーマが実際に地図化に適しているのかを評価する必要がある。さらに、抽出データ数の多いテーマに対しては、先行研究同様、テーマに適した有効な写真を自動的に選別するためのルールの構築が必要である。これは、枚数が多すぎると人力での判別が追い付かず、今後の他地域や他期間への応用が難しいからである。以上をふまえ、調査は2段階で行った。まず調査1では、地図化が期待できそうなテーマの候補を選定し、対応するキーワードによってサンプルとなる写真を抽出し、さらに目視によって有効写真と不要写真の判別を行った。対象地域は東京駅を中心に東西10km、南北10kmの範囲とし、2013年の1年間に撮影されFlickrに投稿された写真を用いた。地図化するテーマとして選定したのは、夜、雨、猫、桜、ラーメン、コスプレ、東京スカイツリー、などをはじめとした計23テーマである。各テーマについて、有効写真枚数、有効写真率、有効写真の投稿者数と投稿写真枚数の偏り、等のデータを元に、テーマとしての地図化適性を考察した。次に調査2では、調査1において有効写真枚数の多かった、夜、猫、桜、ラーメンの4テーマについて、決定木学習法を用いて、有効写真を自動選別するためのルールを構築した。説明変数として、Flickrに記録されている写真のメタデータ(写真のタイトル、タグ、撮影日時等)や個々の写真に記録されているExifデータ(撮影機材のメーカー、シャッタースピード等)を用いた。構築したルールは、他地域(大阪)で抽出されたデータに適用することで、その有効性を検証した。以上の2つの調査により、①虹のようなテーマは、検索ワードに多義性があり、有効写真率が低くなるということや、②猫やコスプレなど、同一被写体が様々なポーズや表情を見せるようなテーマは、一部の熱狂的なファンにより同じような写真が複数枚投稿されるケースが見られ、投稿者ごとに投稿枚数に偏りが出る、というようなことがわかった。また、自動選別についてわかったことの例としては、①夜の有効写真を自動で選別するためには、シャッタースピードという、そのテーマの写真の特性に合った説明変数が有効で、他地域への応用も利きやすいということや、②一部の人による大量写真投稿がある猫などのテーマは、投稿者の情報に依存しない説明変数を用意することが、他地域にも応用できるルールを構築するためには必要である、ということが挙げられる。本研究では地図化を行いたいテーマごとに、抽出されたデータを分析し考察することで地図化適性に影響する要因を整理し、データ数が多いテーマに対しては自動選別ルールの構築を行い、有効なルール構築に必要な説明変数の性質を明らかにすることで、テーマ別観光マップの作成手法の一部を示した。
Recently, consumers' needs for tourism become more and more diverse. However, ordinary tourist information, such as those in magazines, cannot support the diverse needs of tourists, because such information is usually general tourist information that a large number of tourists want. In contrast, it is expected that useful tourist information can be extracted from CGM data. In particular, many studies about the extraction of tourist information based on geotagged photos in photo-sharing sites have been conducted, thanks to the widespread use of the photo-sharing sites, such as Flickr and Photo-Zou, as well as the spread of the GPS-equipped mobile devices. Those studies include automatic generation of tourism maps which present the land characteristics by classifying a large number of photos on the web, development of an itinerary recommendation system using the trajectory of photo-shooting location data, creation of potential-of-interest maps which visualize popular photo-shooting locations as a heat map based on geotagged photo collections, and so forth. However, these studies hardly respond the recent diverse needs of tourists, because these studies focus on the places to which many people paid attention, using a large amount of photo data. On the other hand, the possibility of generating thematic tourist maps making use of keyword search on photo titles and tags is pointed out in the studies of potential-of-interest maps. This study, therefore, attempts to create various thematic tourist maps based on the studies of potential-of-interest maps, in order to seek the methodology of generating thematic tourist maps from low-cost and useful CGM data. At first, it is necessary to judge what kinds of themes are suitable for creating thematic tourism maps. In addition, it is necessary to develop the rules for discerning effective photos automatically from a large number of the extracted photo data, because the distinction of effective photos by human power is costly when considering the creation of maps in other areas or periods. Thus, we conducted two investigations. First, we selected the candidates of map themes, extracted a collection of sample photos by keyword search for each theme, and distinguished effective photos in each collection by human eyes. We used the photos that have been posted on Flickr, taken in 10km×10km area around Tokyo Station in the year 2013. We selected 23 map themes, such as "night", "rain", "cat", "cherry blossom", "ramen", "cosplay", and "Tokyo Skytree". For each theme, we discussed the suitability for mapping, considering the total number of effective photo, ratio of effective photo, and deviation of the number of photos posted by users. Then, we developed the rule for distinguishing effective photos automatically using decision trees for four themes with a large number of effective photos: "night", "cat", "cherry blossom", and "ramen". As explanatory variables, we used the metadata of photos recorded by Flickr (title, tags, shooting date and time, etc.), as well as Exif data recorded in the data of individual photos (manufacturer of photographic equipment, shutter speed, etc.) We examined the effectiveness of the developed rules by applying them to the data in other area (Osaka). As a result of the first investigation, we revealed i) the themes expressed by polysemic words, such as "rainbow", lead to low effective photo, and ii)the themes with enthusiastic fans who post a large number of photos, such as "cat" and "cosplay", lead to the deviation in the number of photos posted by users. Then as a result of the second investigation, we revealed i) in order to discern automatically the effective photos of "night", the explanatory variables that match on the characteristics of the photos of the theme, such as "shutter speed", is effective, and ii) the themes with enthusiastic fans, such as "cat", requires the explanatory variables that do not depend on the characteristics of specific contributors. In this way, this study clarified several factors that affect the suitability of mapping from the analysis of the extracted data for each theme. In addition, we developed several rules to discern effective photos automatically for several themes, and clarified the nature of the explanatory variables required for the development of effective rules.
Full-Text

https://tokyo-metro-u.repo.nii.ac.jp/?action=repository_action_common_download&item_id=3468&item_no=1&attribute_id=18&file_no=1

Number of accesses :  

Other information