[出典] "AlphaFold predictions are valuable hypotheses and accelerate but do not replace experimental structure determination" TerwilligerTC, Liebschner D, Croll TI. et al. Nat Methods. 2023-11-30. https://doi.org/10.1038/s41592-023-02087-4 [著者所属] New Mexico Consortium (Los Alamos), Los Alamos National Laboratory, Lawrence Berkeley National Laboratory, Cambridge Institute for Medical Research, Duke U, UC Berkeley.

 AlphaFoldを代表とする人工知能 (AI) に基づくタンパク質構造予測法は、構造生物学に革命をもたらした。しかし、これらの予測精度は様々であり、また、リガンド、共有結合修飾、その他の因子は考慮されていない。米英の構造生物学・生物物理学の研究チームが今回、こAlphaFoldによる予測値と実験的な結晶構造マップを直接比較することにより、AlphaFoldによる予測値がタンパク質の構造をどの程度説明できるかを評価した。

 多くの場合、FIg. 1AlphaFold予測は実験マップと驚くほどよく一致した [Figure 1引用右図左端のaとe参照]が、大きな差がある例も多々あった。AlphaFold予測は、リガンド、イオン、共有結合修飾、環境因子の存在を考慮していないため、これらの因子に依存するタンパク質構造の多くの詳細を正しく表現することは期待できない。

 AlphaFold予測では残基特異的信頼メトリックス (pLDDT: the predicted value of the local distance difference test) が生成される。pLDDTは、DeepMindチームによって詳細に調査され、不偏性がなく、推定するLDDTメトリックと良好な相関があることが示された(ピアソンの相関0.76) し、したがって、pLDDTは、確かに、予測精度の残基固有の指標として非常に有用である。今回検討した構造では、AlphaFold予測のうち、信頼度が非常に高い部分 (pLDDT > 90、解析対象残基の86%) はTable 1一般的に非常に正確であった(寄託モデルとのCα座標差の中央値は0.6Å)。しかしながら、非常に高い信頼性で予測された残基の約10%は、寄託モデルと2Å以上の差があったことに注意することが重要である [表1引用右図参照]。

 こうした結果から、研究チームは、AlphaFold予測は並外れて有用な仮説であると考えることを提案した。さらに、AlphaFold予測を解釈する際には、予測の信頼性を考慮することが重要であり、構造の詳細、特に予測に含まれない相互作用が関与する構造の詳細の検証のために、実験的構造決定を実施することが重要であることを示唆した。

 研究チームは一方で、今回明らかになった限界にもかかわらず、AlphaFold予測はすでに、タンパク質構造に関する仮説を生み出し、検証する方法を変えつつあり、AlphaFoldの予測を出発仮説として用いることで、実験的な構造決定のプロセスを大幅に加速することができるとした。AlphaFold予測は特に、局所的な構造的特徴に関する優れた仮説をもたらす。例えば、今回解析した102種類の構造において、「好ましい」ラマチャンドラン配座を持つ残基の割合が98%に達し、AlphaFold予測は対応するPDB寄託モデルの97%を上回り、異常値と分類された側鎖配座の平均割合は、寄託モデルの1.5%に対し、わずか0.2%であった。

 いまは、構造生物学におけるAI手法の利用がますます拡大する時代の始まりに過ぎない可能性が極めて高い。AIのアプローチは、タンパク質だけでなく、核酸、リガンド、共有結合修飾、環境条件、これらすべての要因の相互作用、そして複数の構造状態の予測へと確実に拡張されていくだろう。このような予測の精度や、それに伴う不確実性は、新たな要素が含まれるようになり、配列や構造情報のデータベースが拡大するにつれて、継続的に改善されるていくであろう。その結果得られる予測は、ますます有用な構造仮説となり、生物系の実験的・理論的解析の確かな基礎となるだろう。

[論文のRESULT部分の構成]
  • Comparing AlphaFold predictions with density maps
  • Distortion and domain movement in AlphaFold predictions
  • Comparing AlphaFold side-chain predictions with experimental maps
  • Using confidence (pLDDT) to estimate errors in AlphaFold predictions