Technical Report 標的タンパク質の立体構造を用いたリガンド候補化合物の上限サイズの推定による化合物フィルタリング
Compound filtering by estimation of the candidate compound's upper limit size using target protein structure

柳澤, 渓甫  ,  大上, 雅史  ,  石田, 貴士  ,  秋山, 泰

2017-BIO-49 ( 6 )  , pp.1 - 7 , 2017-03-16
化合物群から薬剤候補化合物を選別するための計算手法としてタンパク質 - 化合物ドッキングがよく用いられるがこの手法は計算量が大きいため,一般に膨大な化合物ライブラリから対象とならない化合物群をあらかじめ削減する前処理が必要である.化合物群の削減には Lipinski の法則などの物理化学的な特徴量の閾値の適用や,機械学習などの手法が用いられてきたが,これらはドッキング計算と組み合わせることが考慮された手法ではなかった.そこで本研究では,ドッキング計算と組み合わせることを前提としたフィルタリングについて,(1) タンパク質のポケットサイズの推定手法を利用した化合物体積の上限の推定,(2) 少量のサンプル化合物を試験的にドッキング計算することによる化合物体積の上限の推定,の 2 つの手法を提案した.2 つの手法のうち,後者のサンプル化合物のドッキング計算を用いて閾値を決定する手法ではドッキング可能な化合物の取りこぼしを 0.5% 未満に抑えつつ約 15% の化合物を評価対象から削減することができた.
Protein-ligand docking is widely used as a computational method for drug candidate compound selection, however, the docking simulation is computationally expensive. Thus methods that filter out obviously unnecessary compounds prior to computationally expensive docking simulations have been proposed. In order to reduce the number of candidates, applying physicochemical thresholds like Lipinski's rule of five or filtering with machine learning are widely used. However, they are not considered to be combined with docking simulations. In this study, we proposed two methods presupposed to combine with docking simulation : (1) estimation of the upper limit of compound volume using a protein pocket size estimation method, and (2) estimation of the upper limit of compound volume by experimentally docking smaller amount of sample compounds. The sample compound docking method omitted 15% compounds overlooking only 0.5% dockable compounds.

Number of accesses :  

Other information