[出典] "AlphaFill: enriching AlphaFold models with ligands and cofactors" Hekkelman ML, de Vries I, Joosten RP, Perrakis A. Nat Methods 2022-11-23. https://doi.org/10.1038/s41592-022-01685-y [著者所属] Netherlands Cancer Institute.
AlphaFoldやRoseTTAfoldに代表される人工知能(AI)をベースとする手法は、これまでにない高精度なタンパク質構造予測を可能にし、生体分子科学に変革をもたらした。しかし、AlphaFoldデータベースを検証すると、生体分子の構造または機能に必須な低分子の座標が全て欠落している:ヘモグロビンにおけるヘム;ジンクフィンガーにおける亜鉛イオン;メタロプロテアーゼにおける金属イオン。また、生体機能に重要なリガンドも含まれていない:ATPアーゼまたはキナーゼかにADPまたはATPが結合していない。
オランダの研究チームは今回、配列と構造の類似性を利用して [*]、実験的に決定された構造から予測されるタンパク質モデルへ、このような「欠落」した小分子やイオンを「transplant / 移植」するアルゴリズム、AlphaFill、を開発し、実験的に得られていた構造に対して検証した。
AlphaFillは、2022年2月時点の995,411種類のAlphaFoldモデルに対してのべ12,029,789個の低分子を成功裡に「移植」し、
586,137種種類のAlphaFillモデルを導出し、その結果を関連する検証指標とともにalphafill.eu データバンクから公開した [Webサイトの画面キャプチャを右図に引用]。このデータベースは、研究者が新しい仮説を立て、目標とする実験を設計するためのリソースとなる。

ただし、AlphaFillは、低分子/リガンドの「移植」を高品質の構造ホモログに依存しているため、DALI34 や PDBeFold35 などで示されているように、配列の類似性とは関係なく発生するある種の構造ドメインには対応していない。こうした構造ドメインが関与する場合は、AlphaFold構造予測革命に使用されたものと同様の深層学習の概念に基づく構造をベースとしたアルゴリズムによってAlphaFillを補完することが期待される。
[*] AlphaFillアルゴリズム概要
- PDB-REDOデータバンク のAlpha-Foldデータベースで各構造の配列相同性を検索する。
- 少なくとも85残基の配列がアラインメントされ、25%以上の同一性を持つ構造をヒットとみなす。
- PDBにある最も一般的なリガンド、およびCoFactorデータベースに登録されている補因子とその類似体が移植の候補とした(現時点で、PDBに出現する全リガンドの95%以上を占める2,694種類の化合物を移植した)。
- 関心のある化合物を含む構造の選択について、AlphaFoldモデルのCα鎖に構造アライメントをとり、RMSDを算出する (これをglobal r.m.s.d.と呼ぶ)。
- その上で、最も近いホモログから始めて、移植候補の各化合物の原子から6Å以内のすべてのバックボーン原子を選択し、AlphaFoldモデルへの局所構造アライメントを行い、このアライメントのRMSDも計算する。(これをlocal r.m.s.d.と呼ぶ )。
- 続いて、化合物を移植したAlphaFoldモデルがAlphaFillモデルとなる。ただし、移植候補の化合物のセントロイドから3.5Å以内に同じ化合物が既に配置されている場合(以前に考慮されたホモログに由来する場合は除く)。
コメント