紀要論文 均衡会話コーパス設計のための一日の会話行動に関する基礎調査
Survey of Conversational Behavior : Towards the Design of a Balanced Corpus of Conversational Japanese

小磯, 花絵  ,  土屋, 智行  ,  渡部, 涼子  ,  横森, 大輔  ,  相澤, 正夫  ,  伝, 康晴  ,  Hanae, KOISO  ,  Tomoyuki, TSUCHIYA  ,  Ryoko, WATANABE  ,  Daisuke, YOKOMORI  ,  Masao, AIZAWA  ,  Yasuharu, DEN

(10)  , pp.85 - 106 , 2016-01 , 国立国語研究所
ISSN:2186-134x print/2186-1358 online
NII書誌ID(NCID):AA12536262
内容記述
本稿では,国立国語研究所共同研究プロジェクト「均衡性を考慮した大規模日本語会話コーパス構築に向けた基盤整備」(リーダー:小磯,2014年7月~2015年8月)の活動について報告する。本プロジェクトの目標は,21世紀初頭の日本語母語話者の多様な会話行動を納めた大規模な日本語日常会話コーパスの構築を目指し,その基盤整備として,(1)均衡性を考慮した会話コーパスの設計,(2)種々の日常場面での会話を収録するための方法論,(3)日常会話を適切・効率的に転記するための方法論の策定を進めることである。本稿ではこのうち(1)に焦点を当て,均衡性を考慮したコーパス設計案を策定するために実施した,一日の会話行動の種類と従事時間に関する調査について報告する。調査では,首都圏在住の成人約250人を対象に,起床から就寝までの間に行ったそれぞれの会話について,いつ,どこで,誰と,何をしながら,どのような種類の会話を,どのくらいの長さ行ったか,などを問う調査項目に回答してもらった。その結果,日常会話には以下の傾向が見られることが分かった。(1)雑談や用談・相談が多く,会議・会合や授業・レッスン・講演は少ない。(2)少人数・短時間の会話が多い。(3)自宅や職場・学校など,私的あるいは公的に主たる空間での会話が多い。(4)いくつかの調査項目の間には対応関係が見られる。これらの分析結果にもとづき,均衡性を考慮した日常会話コーパスの設計方針について議論する。
In this paper, we report on the activity of a preparatory project to build a large-scale corpus of conversational Japanese (NINJAL collaborative research project, 2014/7/1-2015/8/31). The overall aims of this project are: i) to establish a corpus design for collecting various kinds of everyday conversations in a balanced manner, ii) to develop a methodology of recording naturally occurring conversations, and iii) to create a transcription system suitable for effectively transcribing natural conversations. This report focuses on the first issue of establishing a corpus design. We first describe our survey of everyday conversational behavior, conducted with about 250 Japanese adults last year, in order to reveal how diverse our everyday conversational behavior is, and to build an empirical foundation for corpus design. The questionnaire included when, where, how long, with whom, and in what kind of activity informants were engaged in conversations. We found that ordinary conversations show the following tendencies: i) they mainly consist of chats, business talks, and consultations; ii) in general, the number of participants is small and the duration is short; iii) many conversations are conducted in private places such as homes, as well as in public places such as offices and schools; and iv) some questionnaire items are related to each other. Based on these results, we discuss how to design a balanced corpus of conversational Japanese.
本文を読む

https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=824&item_no=1&attribute_id=22&file_no=1

このアイテムのアクセス数:  回

その他の情報