Thesis or Dissertation Biterm Topic Model Based Classification of E-learning Course Reports

徐, 釗  ,  ジョ, ショウ

pp.1 - 51 , 2015-03-25 , The University of Electro-Communications
Description
近年、Computer Supported Collaborative Learning(CSCL)システムが開発されている。CSCLはコンピュータ技術を利用して、学習コミュニティの中での知識の共有と建設を特徴としている。しかし、CSCLは同時に同一トピックを学習するメンバによって構成される学習コミュニティを支援するので,メンバの熟達レベルの多様性が小さく,他者から学び方や学習成果を共有できる範囲は限定される。この制限を克服するために、eポートフォリオシステムは提案されている。E-ポートフォリオシステムは長年にわたって学習者の成果や情報を収集することができる。これらのデータから有用な情報を見つけて、他の学習者を助けるために、トピックモデルが適用されているeポートフォリオシステムが提案されている。  トピックモデルは、ドキュメントのコレクションで発生する抽象的な「トピック」を発見するための統計モデルの一種である。Latent Dirichlet Allocation(LDA)は、eポートフォリオに適用することが提案されている。しかし、LDA はデータがスパースな場合、推定精度が落ちるなどの問題がある。まず、短い文書では、ほとんどの単語が一度だけしか出現しない。つまり、単語の出現頻度から、重要な単語を識別なことが困難である。第二に、多くの単語の意味は、その単語が出現する文脈によって決定される。短い文章では、関連する単語の数によって制限されてきたので、それが曖昧な単語のトピックを識別することは困難である。こんなデータのスパースは、伝統的なトピックモデルの推定精度に影響を与える。この問題に対処するために、Biterm Topic Model(BTM)が提案されている。本研究では、文書分類のための代わりにLDAのBTMを使用するように触発されている。   BTMのパフォーマンスを測定するために、本研究は、eラーニングシステム"samurai"に蓄積されている学習者レポートを用いた。実験の結果は、1)BTMはLDAより推定したトピックを構成する単語の一貫性が高い。2)BTMはLDAよりトピックの推定精度が高い。

Number of accesses :  

Other information