[出典] Smirnov P, ~ Haibe-Kains B. “PharmacoDB: an integrative database for mining in vitro anticancer drug screening studies” Nucleic Acids Res, gkx911. Published 09 October 2017. bioRxiv Posted September 27, 2017.
  • 最近の癌ゲノム薬理学(pharmacogenomics)研究において、大規模な細胞パネルを利用した数百の抗がん剤および候補化合物スクリーニングが繰り返されている。スクリーニングの目的は、細胞株の化学的摂動に対する感受性と細胞株に特有なゲノムの特徴との相関を明らかにし、薬剤応答の新たな予測指標を開発することにある。しかし、その目的を達成するのは容易ではない。細胞株と化合物のアノテーションと薬剤応答の定量が標準化されていないからである。さらに最近、種々のスクリーニングの実験プロトコルが複雑で相補的なことから、in vitro実験の結果が大きく変動することも明らかにされた。したがって、大規模スクリーニングの結果が集積されたデータセット群を対象として、厳密な比較と統合的解析を可能にするツールが必要である。これに応えてBenjamin Haibe-Kains(U. Health Network)等は今回、これまでに公にされた癌ゲノム薬理学研究の成果を、マニュアルキュレーションも加えて、統合した最大のデータベース、PharmacoDB、を開発した。
PharmacoDBに統合されたデータベース(挿入図 Table 1参照)
Table 1
  • HomePageに表示されている統計(2017/10/28):7 データセット;41 組織;1,691 細胞株;19,933 遺伝子;759 化合物;実験 650,894件
PharmacoDBの作りと使い方(挿入図 Figure 1参照)
Figure 1
  • (A) 検索項目/例:細胞株/’22rv1’; 組織/’endometrium’; 薬剤/’paclitaxel’; データセット/’CCLE’; 細胞株と薬剤/’22rv1 paclitaxel’; 複数データセット/’CCLE CTRPv2’; 
  • (B) 主要データカテゴリー:細胞株;遺伝子/標的;組織;薬剤/化合物;データセット
  • (C) 該当データの可視化 
  • (D) PharmacoGx: ゲノム薬理学データセット解析用Rパッケージ()へのリンク
  • (検索結果例) 用量-反応曲線:(挿入図Figure 4参照)
Figure 4
PharmacoDB構築手順
  • 細胞株と薬剤・化合物をデータベース間、および、細胞株データベース Cellosaurusや、化合物情報システム・データベースであるSMILES, InchiKeyまたはPubChemと付き合わせ、いずれかのデータセット1つにだけ存在した細胞株と薬剤・化合物にはPharmacoDB独自IDを付与。プログラムによる自動判定で、データベース間で共有されているIDがほぼ倍増し、マニュアル判定でさらに32%増加した(挿入図 Figure 2参照)。
Figure 2
PharmacoDBの特徴
  • 一連のゲノム薬理学データベース、PharmGKBPGMDおよびDruGeVarにはそれぞれ特徴があるが、いずれも論文から細胞株と薬剤・化合物の相関を抽出しているのに対して、PharmacoDBの特徴は、ハイスループットな分子プロファイリングと薬剤スクリーニングアッセイによる大規模なin vitroゲノム薬理学実験からのデータセットを統合したことにある。さらに、統計的解析を可能にするプログラムパッケージPharmacoGxも内包している。