Conference Paper 全層ゲート付き2次元畳み込みネットワークによる多重音信号の音高認識

生田目, 敬弘  ,  Namatame, Takahiro  ,  亀岡, 弘和  ,  KAMEOKA, Hirokazu  ,  篠田, 浩一  ,  Shinoda, Koichi

120 ( no. 12 )  , pp.1 - 7 , 2018-02 , 情報処理学会
Description
音楽は音高方向 (和音構成,調波構造) と時間方向 (旋律,リズム) の 2次元構造を有する.我々は,音楽音響信号の音高認識の問題を音響スペクトログラムに対する音高ラベルの 2 次元的な配置問題と捉え,多重音信号の対数周波数スペクトログラムから直接音高認識を行う全層ゲート付き 2 次元畳み込みネットワークを提案する.全層がゲート付き 2 次元畳み込みネットワークで構成され,楽音の音響スペクトログラムと音楽の 2 次元構造を各層で表現する.従来の確率的潜在成分分析手法と比較し,Bach10 データセットにおいて従来手法の音符単位 F1 スコア 65.0% を 8.3% ポイント上回る 73.3% の性能を得た.また,室内楽データセットを新たに構築し,モデルの学習に用いた

Number of accesses :  

Other information