Departmental Bulletin Paper テキストからの対象物認識に有用な記述内容 : 動物を例に
Encyclopaedic Descriptions That are Useful for Identifying Entities: A Case Study of Descriptions of Animals

加藤, 祥  ,  Sachi, KATO

(9)  , pp.23 - 50 , 2015-07 , 国立国語研究所
ISSN:2186-134x print/2186-1358 online
NCID:AA12536262
Description
テキストの示す対象物を認識するために,どのような内容を記述することが有用か。本稿では,動物を例にした3種類の実験に基づく考察結果を報告する。複数辞書に共通して記載のある語釈,辞書の語釈に不足しているとされた情報を追加したテキスト,コーパス(現代日本語書き言葉均衡コーパス・Google日本語n-gram)から取得した用例を用い,それぞれのテキストから対象物を同定する実験を行った。どの実験結果でも正答率は半数程度にとどまり,テキストのみからの対象物認識は困難であった。また,対象物の認識に求められた情報は,主に読み手の経験や知識を喚起する情報と,提示された情報によって設定したカテゴリにおける他メンバーとの差異に関する情報であった。我々が実際目にするテキスト(コーパス)からは,個別的一般的な経験や知識は取得しやすく,予め読み手の保有している知識と合致した場合には有用な情報となる。しかし,対象物に関する知識が読み手に不足している場合,対象物の認識には親カテゴリのプロトタイプとの差異を記述することが有用であり,あるいは誤認を避けるために他メンバーとの差別化が可能な記述を行うことが有用であるとわかった。
This paper reports what features of encyclopaedic descriptions are useful for recognising entities based on the results of three experiments on target object identification from texts. We used gloss descriptions of animals compiled from dictionaries (Experiment 1), texts with additional information not found in the dictionaries (Experiment 2), and usages acquired from corpora (Balanced Corpus of Contemporary Written Japanese, Google Japanese N-grams; Experiment 3). In all three experiments, the percentage of the entities which could be identified correctly from texts was only about half. Therefore, we conclude that it is difficult to recognise an entity based on its description in a text. The results of the three experiments suggest that the following information is important for the identification of the target: specific features selected based on participants' personal experiences and information that would distinguish the target animals from other members in the ad hoc categories were important for identification of the target. When readers have knowledge about the target entities, individual or general experience and knowledge are easily obtained from corpora, as the actual texts are useful for readers' recognition. In contrast, when readers have insufficient knowledge about the target entities, a description of the features that distinguish the target from the prototype of the superordinate category (ad hoc category) is useful.
Full-Text

https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=469&item_no=1&attribute_id=22&file_no=1

Number of accesses :  

Other information