紀要論文 統合検索のための共通メタデータと歴博データベースのデータ項目のマッピング
Mapping of REKIHAKU Database's Fields to Common Metadata for Integrated Retrieval

安達, 文夫

内容記述
人間文化研究機構では,機構を構成する各機関が公開する100を超える多種で多様なデータベースをまとめて検索できる統合検索システムを構築し,2008年4月よりサービスを開始した。このシステムは,個々のデータベースの所在や操作方法を意識することなく検索できることに特徴がある。多くのデータベースと同様に,検索語とのマッチング,検索結果の一覧表示と詳細表示を基本機能としているが,個別に作成されデータ項目がまちまちなデータベースをまとめて検索する上で,共通メタデータが主要な役割を果たしている。この共通メタデータに,個々のデータベースのデータ項目をいかにマッピングするかが重要な課題であった。統合検索の対象とした国立歴史民俗博物館の43のデータベースをマッピングする上での考え方を記した。見やすい詳細表示とするには,共通メタデータの特定の要素に,データ項目が集中しないようマッピングする必要がある。この方針に沿って,共通メタデータとして採用したDC(Dublin Core メタデータ)に,実物の資料を記述したデータベースを適用することは,要素の意味の拡張が必要となって,適合性が低い。このことを,博物館資料の情報流通向けに提案した博物館コアメタデータの要素とDCの要素の対応付けを通して明確にした。一方,博物館コアメタデータは,資料に関するデータベースだけでなく,遺跡や種々の文献から研究の関心を抽出した事項,ならびに研究文献に関するデータベースにおいても,そのマッピングに親和性がある。これは,記述の要素として役割や出来事の内容を問わない形で人物,時間,空間を取り出すとともに,共通性が高く記述対象を特徴づける名称,種別,主題を要素としていることが大きい。より汎用的なメタデータを求めるなら,残りの要素の抽象化を図るとともに,共通化の可能性を探ることが重要となる。
The National Institutes for the Humanities established an integrated retrieval system for the over 100 diverse databases provided by its member organizations and launched the service in April 2008. This system is characterized by its intuitive usability and enhanced algorithm to allow users to retrieve any data regardless of its operation method or location. Like most other search engines, the system enables users to retrieve information matching their search terms and shows a list and detailed description of search results. In this system, however, a common metadata set plays an important role in order to retrieve data from databases developed separately and therefore organized by different attributes. A key issue of realizing the system is how to map data attributes from the different databases to this common metadata set. This paper describes a basic idea of mapping 43 databases of the National Museum of Japanese History for this integrated retrieval system.In order to show detailed search results in an easy-to-understand way, it is essential to map data attributes in a way that some metadata searches do not make too many requests. Based on this idea, the Dublin Core (DC) Metadata Elements, adopted as a common metadata set, is not highly compatible to search engines retrieving information from databases based on descriptions of physical materials because the meanings of the elements need to be expanded. This problem has been revealed by comparing the Museum Core Metadata Elements (which were developed to share information on the collections of the Museum) with the DC Metadata Elements. The Museum Core Metadata Elements can support the mapping of databases not only of physical materials but also on historical sites, as well as various research documents and their research purposes. This is because the Museum Core Metadata Elements can be used as description elements to retrieve information on people, time, and space, regardless of content in the form of role and achievements, and because they are often the interchangeable elements of name, type, and subject that attribute specific features to the objects being described. If there is a need to use the metadata set for more diverse purposes, it will be essential to abstract the remaining elements and explore their similarities.
本文を読む

https://rekihaku.repo.nii.ac.jp/?action=repository_action_common_download&item_id=2293&item_no=1&attribute_id=22&file_no=1

このアイテムのアクセス数:  回

その他の情報