Thesis or Dissertation 線形計画 MAP 識別器へのマルチカーネル学習適用法に関する研究

佐藤, 光  ,  サトウ, ヒカル  ,  Sato, Hikaru

pp.1 - 50 , 2016-03-25 , The University of Electro-Communications
Description
パターン認識とは,与えられた標本からパターン(規則性)を抽出し,予め任意に定められた概念に対応づける機能のことである.パーセプトロンを発端とし,これまで数多くの識別手法が提案されてきた.線形計画MAP識別器(Maximum A Posteriori based kernel classifier trained by Linear Programming; MAPLP)はNopriadiとYamashitaによって2010年に提案された,最大事後確率推定に基づく識別手法である.MAPLPでは事後確率を直接モデル化・計算する代わりに,ベイズ決定則を満たす代理関数を定義することで,識別器を線形計画法により容易に学習できる.しかし,MAPLPでは入力データに関する条件付き密度を考慮せず,標本点のみに適合する学習を行っているため,学習標本数が少ない場合に過学習し,未知データに対する汎化能力が低下する恐れがある.さらに,カーネル法の拡張手法として知られるマルチカーネル学習を直接適用することができないという欠点も存在する.本研究では,線形計画MAP識別器に対して,「各クラスにおける入力データの条件付き確率密度関数の推定による拡張手法」と「マルチカーネル学習適用による拡張手法」を提案する.入力データの条件付き確率密度関数を予めモデル化することで,学習標本数が少ない場合でも過学習を緩和できると考えられる.また,マルチカーネル学習を適用することにより,カーネル関数を複数の重み付きカーネルの線形和により表現をすることが可能になり,シングルカーネルを用いた場合の最適パラメータ推定が不要になる.さらに,汎化能力の高い識別器を構築することが可能になると考えられる.本研究では識別手法の性能評価として2クラス識別実験を行った.確率密度推定適用法では,カーネル密度推定による拡張手法が既存手法より高い識別性能を示した.マルチカーネル学習適用法では,各カーネルの重みパラメータの初期値を一定とした場合,多くの識別問題で確率密度推定適用法と比較して識別性能が低下した.他方で,各カーネルの重みパラメータの初期値をシングルカーネルにおける最適値を用いて調整した条件下では,確率密度推定適用法と同程度の識別性能を示した.この結果から,マルチカーネル学習適用法の識別性能はカーネル関数の重みパラメータの初期値に大きく依存している,ということが分かった.

Number of accesses :  

Other information