紀要論文 『日本語日常会話コーパス』における転記の基準と作成手法
Criteria and Composition Method of Transcription for the Corpus of Everyday Japanese Conversation

臼田, 泰如  ,  川端, 良子  ,  西川, 賢哉  ,  石本, 祐一  ,  小磯, 花絵  ,  Yasuyuki, USUDA  ,  Yoshiko, KAWABATA  ,  Ken'ya, NISHIKAWA  ,  Yuichi, ISHIMOTO  ,  Hanae, KOISO

(15)  , pp.177 - 193 , 2018-07 , 国立国語研究所
ISSN:2186-134x print2186-1358 online
NII書誌ID(NCID):AA12536262
内容記述
本稿は,平成28年度から構築を進めている『日本語日常会話コーパス』における転記の基準と作成手法について述べる。本コーパスには,日常場面で自然に生じるさまざまなタイプの会話200時間がバランス良く収録される予定である。日常会話には,極めてくだけた表現や,聞き取りづらい,あるいは把握しづらい表現が頻出する。こうした会話データを多人数により均質に書き起こすには,転記のための基準を明確に定める必要がある。また,200時間という大量の会話を限られた期間で書き起こすために,効率的に作業をするための工夫が必要になる。本プロジェクトでは,実際の会話データを対象に転記を行いながら,効率的に作業をするための工程を検討し,ツールの開発や転記基準の改訂を行ってきた。本稿では,このようにして策定した転記基準と,作業を効率的に進めるために整備した方法について紹介する。
This paper describes the criteria and composition method of transcription for the Corpus of Everyday Japanese Conversation, which has been in construction since 2016 and will contain 200 hours of various types of conversations in a balanced distribution. As some expressions are extremely informal, hard to hear, or hard to understand, it is necessary to establish clear criteria for transcription to ensure homogeneous transcription quality from a large number of staff. Methods are also required to transcribe no less than 200 hours of conversations efficiently and in a timely manner. As part of this project, procedures for efficient transcription have been considered, and the development of tools and the revision of criteria of transcription have been conducted. This paper presents said transcription criteria and methods.
本文を読む

https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=1618&item_no=1&attribute_id=54&file_no=1

このアイテムのアクセス数:  回

その他の情報