Departmental Bulletin Paper Constructing a Database of Japanese Lexical Properties : Outlining its Basic Framework and Initial Components1

Joyce, Terry  ,  増田, 尚史  ,  Hodošček, Bor

8pp.35 - 60 , 2016-03-31 , 多摩大学グローバルスタディーズ学部
In order to be able to conduct meaningful research into all aspects of language, it is essential for language science and cognitive science researchers to have practicalaccess to an increasingly wider range of detailed and contemporary information about their target languages. Against that background, this paper presents a short overview summary of an ongoing project to construct a largescale database of Japanese lexical properties (JLP). More specifically, after outlining the concurrent construction of the ontology of Japanese lexical properties (JLP-O; Joyce & Hodošček, 2014), which provides the basic guiding framework for the JLP database construction project, the paper also outlines the initial core components of the JLP database, with particular emphasis on two of those components;namely, a database of semantic transparency (ST) ratings for approximately 10,000 two-kanji compound words and some initial results for the extraction and automatic analyses of the word structures of both three- and fourkanji compound words.
言語科学者や認知科学者にとって,言語のあらゆる側面について有意義な研究を企図するためには,目的とする言語に関する詳細かつ現代的な幅広い情報に実用可能なレベルでアクセスできることが必要不可欠である。このことを背景として,本稿では,日本語の語彙特性に関する大規模データベースの構築を目指して現在進行中のプロジェクトについての概要を説明する。具体的には,この日本語語彙特性データベース構築プロジェクトに対して基本的な枠組みを提供する,日本語語彙特性に関するオントロジー(Joyce & Hodošček, 2014)の構築について概観したのちに,日本語語彙特性データベースの主要中核要素について略述する。特に,約10,000 の漢字二字熟語に対する意味的透明性の評定データベースと,漢字三字および四字の熟語の抽出とその語構造に対する自動分析に関する主要な結果という2 種類の中核要素を取り上げて論じる。

