Conference Paper メモリアクセスパターン依存故障の注入のためのQEMUベース故障注入器

小林, 佑矢  ,  Kobayashi, Yuya  ,  實本, 英之  ,  JITSUMOTO, HIDEYUKI  ,  野村, 哲弘  ,  Nomura, Akihiro  ,  松岡, 聡  ,  MATSUOKA, SATOSHI

Description
並列計算機の大規模化で,Silent Data Corruption (SDC) による信頼性低下が懸念されている.SDC は検出が困難な障害で,対応にはコストがかかる.適切な方法を構築 ・ 選択するには,故障注入によるオーバーヘッドや耐故障性の評価が重要になる.しかし,これまでの故障注入器はランダムなビットフリップを行うものが多く,ハードウェア特有の故障パターンを再現できない.本研究では実故障の注入を目的として,仮想マシンエミュレータ QEMU を拡張し,故障注入器 MH - QEMU を作成した.MH - QEMU では,メモリ状態の変更のみならず,仮想マシンのメモリへのアクセスを検知 ・ 処理できるメモリアクセスハンドラ機能を実現した.これによりメモリアクセスパターン依存故障や永続的故障を注入できる.これらの機能のオーバーヘッドは仮想マシン上のワークロードごとに異なり,NAS Parallel Benchmarks (NPB) を用いた場合には,もっともよい場合で実行時間が約 20 倍で抑えられることを確認した.さらに,NPB の CG カーネルに対し,シングルビットフリップの注入では約 100% の割合で計算が正常終了したが,Row - Hammer の注入では,約 40% の割合で異常終了が起き,3% の割合で SDC が発生することを確認した.

Number of accesses :  

Other information