紀要論文 Random Forestsを使用したAgatha Christie作品の文体分析 : Dorothy Sayersと比較して

土村, 成美  ,  ツチムラ, ナルミ  ,  Tsuchimura, Narumi

2016pp.43 - 54 , 2017-05-31 , 大阪大学大学院言語文化研究科 , オオサカダイガク ダイガクイン ゲンゴブンカ ケンキュウカ , Graduate School of Language and Culture, Osaka University
内容記述
テクストマイニングとデジタルヒューマニティーズ
本研究ではミステリ一作家 Agatha Christie 作品における特徴語に関して,同時代の女性ミステリ一作家 Dorothy Sayers との比較を通して計量的な分析を行うことを目的とする。分析手法として,アンサンプル学習の一種であるRandom Forests を使用し,高頻度語を変数とした2作家の作品の分類を行い,分類に寄与した特徴語について検討を行う。Random Forestsを実行した結果,ChristieとSayersの作品を90%を超える正解率で分類することが出来た。抽出された特徴語話として, Sayers がeverybody, anybody のような-body 形名詞やtill が挙がるのに対して,Christie はeveryone,anyone のような-one 形名詞やuntil を多用していることが明らかになった。また,Christie 側には女性代名調や動詞の過去形が多く特徴語として抽出され,これらの語をChristie が特徴的に用いることが明らかになった。動詞の過去形の中でも動作にまつわる動詞に注目すると,発話を導く際に発話動詞に加えて登場人物の動きを表現したり,頷くという行為一つを取っても様々な-ly副詞と共起させて表現したりと,登場人物の行動の描写が工夫されており,Christie作品が読者にとって情景描写を行いやすく,現在でも広く普及している一要因となっているのではないかと考えられる。
This study tries to make a quantitative analysis on characteristic words in Agatha Christie works, comparing with her contemporary Dorothy Sayers. This study applies Random Forests, one of ensemble learn in g method s, for classifying the two writers ’works. The variables used in Random Forests are the most frequent words, and we discuss the 100 the most characteristic words. The results of this analysis revealed that Christie’s use of characterist ic words contrasted with Sayers’,especially between synonyms: Christie tends to use someone, anyone and until while Sayers tends to use somebody, anybody and till. Moreover, Christie tends to use words related to the female gender and a number of past tense verbs. Among the past tense verbs, we focus on the words related to movement. It revealed that Christied escribed characters' behaviour in her novels by using a number of co-occurring words like-ly adverbs, and I assume that this makes readers to imagine scenes in her novels easily. It may be one of reasons why her novels are read and loved all over the world now.
本文を読む

http://ir.library.osaka-u.ac.jp/dspace/bitstream/11094/62018/1/gbkp_2016_t_043.pdf

このアイテムのアクセス数:  回

その他の情報