2018-12-03 crisp_bio注:2018-12-04 DeepMind社深層学習の医療応用査読付き論文へのリンク追加

2020-01-31 crisrp_bio追記:
Proteins誌とNature誌の掲載論文とNature誌NEWS AND VIEWSの書誌情報、およびプログラム入手先を追加:
[出典] "Google's DeepMind predicts 3D shapes of proteins" Sample I. The Guardian 2018-12-02.;"AlphaFold: Using AI for scientific discovery" DeepMind NEWS & BLOG. 2018-11-30.
  • ゲノムから転写・翻訳されたペプチド鎖が正しく折り畳まれる(フォールディング)ことで、機能するタンパク質が形作られる。フォールディング不全に相関する疾患は、アルツハイマー病、パーキンソン病、ハンチントン病、嚢胞性線維症など多数知られている。
  • このタンパク質フォールディングは物理法則に基づいて進行するが、その物理法則が完全には解き明かされていないためにアミノ酸配列から理論的に予測することが現状では不可能である。また、与えられたアミノ酸配列からタンパク質が取り得る構造を全て予測し評価する手法によっても、その組み合わせが膨大なため、フォールディングを完全に予測することは現時点では計算不可能である (レビンタールのパドックス/Levinthal's paradox)
  • タンパク質研究コミュニティーでは、タンパク質フォールデング研究振興ひいてはフォールディング予測精度の向上を目指して1994年以来2年ごとにCritical Assessment of Structure Prediction (CASP) コンペを2年ごとに開催してきた。
  • 本年 (2018年)の第13回CASP (CASP13)では、98件のエントリーの中で、深層ニューラルネットワーク (deep natural networks)を基礎とするDeepMindのAlphaFoldがトップに立った (TS Analysis : Group performance based on combined z-scoresのグラフ/テーブルの中のエントリーG043/A7D)。AlphaFoldが43件のタンパク質の中で25件のタンパク質について最も精密な構造を予測したところ、次点の精密構造予測は3件に止まった。
  • 今回のAlphaFoldは、既知のタンパク質構造データでの学習に基づき、新奇ペプチド鎖についてアミノ酸残基ペアの間の距離と残基間の化学結合の角度を予測・評価したのち、機械学習の一手法である勾配降下法 (gradient descent)でエネルギーの観点から最適化した。
参考: DeepMind社からの深層学習医療応用論文