Departmental Bulletin Paper 日韓中同形二字漢字語の品詞性ウェブ検索エンジン

于, 劭贇  ,  玉岡, 賀津雄  ,  YU, Shaoyun  ,  TAMAOKA, Katsuo

29pp.43 - 61 , 2015-12-15 , 名古屋大学言語文化研究会
本検索エンジンは,同形⼆字漢字語の日韓中の3言語間の品詞性およびそれに関連する情報(朴・熊・玉岡,2014a, 2014b; 熊・玉岡, 2014)を,Web上で誰でも自由に閲覧・検索できるように開発した。この検索エンジンは,中国語あるいは韓国語を母語とする日本語学習者や研究者を対象としている。エンジンの構築には,MongoDB,Flask,AngularJSなどの最新の技術を使用した。朴・熊・玉岡(2014a)は,日韓中3言語の8冊の国語辞書をもとに,日本語能力試験の4級から2級までの2,060語の二字漢字語の品詞情報を中心としたデータベースを作成している。しかし,このデータベースは23列(ID番号を除く)の情報からなるExcelの表形式のデータであり,そのままでは閲覧・検索がし難い。そこで,このデータベースを広く一般に利用してもらえるように,多様な検索機能を備えた検索エンジンを開発し,Web上で公開した(。本検索エンジンでは,データを6種類のデータのグループに分け,分かりやすいカードの形で表示した。そして,(1) 単語を個別に確認するのに適した「シンプル検索」および(2)一定の特徴を持つ単語を選び出すのに適した「詳細検索」,の2つの検索機能を構築した。本稿では,この検索エンジンの使用法を説明した。The paper present a search engine developed for Korean and Chinese speakers learning Japanese, which allows users to search grammatical category and related information about 2,060 basic orthographically-similar two-kanji compound words between Japanese, Korean and Chinese (Park, Xiong2& Tamaoka, 2014a, 2014b; Xiong & Tamaoka, 2014). The 2,060 words were taken from the Japanese Language Proficiency Test (JLPT), levels 4 to 2. This search engine was built using a Flask (a framework for Python) and MongoDB back end, with an AngularJS (JavaScript) front end. The MongoDB backend is an improvement on an existing, 23 column Microsoft Excel spreadsheet (excluding ID), which was not easily searchable. The search engine is freely available on line at Each of the 2060 words are visually represented as a card in the search result and each card contains six types of information. The application allows two search functions; (1) ‘simple search’ to discover information for each word, and (2) ‘detailed search’ do list all words with specific features. This paper explained how to use the search engine.

Number of accesses :  

Other information