紀要論文 英語論文から抗体情報を取得する検索モデル
Search Model to Extract Antibody Information from English Articles

木下, 直彦  ,  山本, 格  ,  Kinoshita, Naohiko  ,  Yamamoto, Tadashi

129 ( 4 )  , pp.180 - 186 , 2015-04 , 新潟医学会
ISSN:0029-0440
NII書誌ID(NCID):AN00182415
内容記述
【はじめに】抗体はバイオ分野の実験において重要な研究ツールのひとつである. しかし, 一つの抗原に対して複数の抗体が作製, 販売されていることも多く, 研究者は抗体の選定や判断に困難をきたしている. そこで, 論文内, 特に英語論文からタンパク質に対する抗体情報を取得するための検索モデルを作成し, モデルに基づいた抗体情報自動検索ツールを作成し, その性能を検証した. 【材料と方法】初めに英語論文の中から, 抗原としてのタンパク質名および, 製造会社が記載されている語の出現位置をリスト化した. その後, 製造会社の出現位置を限界点とする区間を設定し, その区間を終点限界点に位置する会社のメタデータ空間と定め, メタデータ空間内にあるタンパク質名を抗原とする抗体 - 製造会社の関係性を取得する抗体情報検索モデルを作成した. その後, UniProt のタンパク質データベースを用い, 自動的に抗原となるタンパク質を検索/検出し, 製造会社と関連付け, リポジトリ化する抗体情報自動検索ツールを作成し, その性能の検証を行った. 【結果】抗体情報検索モデルの検証を行ったところ, 適合率100%, 再現率99.0%, F値99.5%という結果であった. 次に, 抗体情報検索ツールの性能の検証を行ったところ, 適合率は100%であったが, 再現率が39.8%と大きく減少し, 結果としてF値は56.9%と著しい信頼度の低下が見られた. そこで, その原因を調査したところ, 抗体情報が取得できなかった原因の75.8%は, 動物種が異なる同名タンパク質が UniProt データベースに登録されていたため, タンパク質を特定できなかったものであった. そのため, データベースを動物種別に再構築し, 再度検証を行ったところ, 再現率は79.6%まで上昇し, F値も88.6%という高い信頼率となった. 【考察】今回の抗体情報検索モデルについてはF値が99.5%という高い信頼性を示したため, このモデルは抗体情報取得に有効であると考えられた. また, 抗体情報検索ツールでは, 当初再現率が39.8%と, 著しい低下がみられたが, 動物種ごとにタンパク質データセットを編成し, 再検証した結果, 再現率が79.6%まで上昇し, F値も88.6%という信頼率まで改善された. また, 再構築後の抗体情報検索ツールについて, 論文別の信頼度調査を行ったところ, F値が0.8以上の論文が全体の80.9%を占めたことから, 本研究で作成した抗体情報検索ツールは, 研究者が抗体選定する際に有用であると考えられた. 今後この仕組みを改良/発展させることで, さらに多くの研究者に有用な抗体情報検索ツールを構築してゆきたいと考えている.
本文を読む

http://dspace.lib.niigata-u.ac.jp/dspace/bitstream/10191/44052/1/129(4)_180-186.pdf

このアイテムのアクセス数:  回

その他の情報