Departmental Bulletin Paper 近代口語文翻訳小説コーパス構築の概要と計量的分析
Compilation of a Corpus of Translated Works of the Mid-Meiji Era and Its Quantitative Analysis

小西, 光  ,  Hikari, KONISHI

(11)  , pp.37 - 61 , 2016-07 , 国立国語研究所
ISSN:2186-134x print/2186-1358 online
現代日本語書き言葉の原型となる近代日本語の口語文体は,言文一致運動という意識的な文体変革から大きく動き出し,第二期国定教科書の完成・普及によって確立したとされる。近年,この近代口語文体の確立において,欧米文学の翻訳行為が大きな影響を及ぼしたと具体的に論じられ始めた。より詳細にその影響を明らかにするため,明治中期(明治16~30年)に発表された翻訳小説6作品と明治後期(同31~44年)・大正期に発表された創作小説2作品のコーパス構築を行った。本稿では,まず構築したコーパスの概要と,それらの文の長さや文書間類似度の調査結果を示し,明治中期から後期にかけての文体の類似性について指摘する。本稿の調査では,文の長さ(一文における文節数の平均)や品詞比率,MVR(Modifier Verb Ratio)では近似の値を示し,文書間類似度では特徴的な結果は表れなかった。ただし,一文に含まれる接続助詞数のばらつきを調査すると,時代が下るにしたがってばらつきが小さくなるため,やはり時代による差があることは明らかとなった。本稿で用いた手法によると,明治中期の翻訳小説と近代口語文体確立期の創作小説とに類似性が見出せることを示すことができた。これは,明治中期の段階で近代口語文体に近い文が産出され,それが読み手の目に触れていたことを意味しており,欧米の小説を翻訳することによる日本語への影響を示すこととなる。
The modern colloquial style of Japanese had begun to be constructed since the genbun itchi movement, which involved the unification of spoken and written old Japanese. This style had been established and popularized as the standard form of Japanese through the national textbook system (kokutei kyokasho) in the Meiji era. From then on, it became the basis for contemporary written Japanese. Recent discussions have indicated that the translation of European and American literature had affected the establishment of the colloquial style. To quantitatively investigate the effect of the translation work on the style, we compiled a corpus of six translated works of the mid-Meiji era and one each from the late Meiji and Taisho eras.This paper provides an overview of the corpus and the findings of a statistical survey, such as the length of sentence, the similarity between the works, and so on. The survey showed that there are no significant differences between the two sets of works in the number of bunsetsus in a sentence, the rate of POS tagging, Modifier Verb Ratio (MVR), or in their cosine similarities. The quantitative results indicated similarities between the translated works of the mid-Meiji era and those of the late Meiji and Taisho eras. It also supported the assumption that the colloquial style had already become familiar through translated works and read by people of the mid-Meiji era. However, as an exception, the statistics showed that the variance of the conjunctive postposition in a sentence tends to decrease with the passage of time.

