[出典] "High-throughput prediction of protein conformational distributions with subsampled AlphaFold2" Da Silva GM, Cui JY, Dalgarno DC, Lisi GP, Rubenstein BM. Nat Commun. 2024-03-27. https://doi.org/10.1038/s41467-024-46715-9 [所属] Brown U, Dalgarno Scientific LLC. 

 ほとんどのタンパク質は細胞内でダイナミックに形状を変化することから、3次元構造のスナップショットだけでなく、その時間的変化を追跡する必要がある。ブラウン大学を主とする研究チームが今回、タンパク質配列から3次元構造を高精度で予測するAlphaFold2を利用することで、同じタンパク質が取りうる一連のコンフォメーションのアンサンブルと、各コンフォメーションの相対的な頻度を予測可能なことを示した。

[詳細]

 AF2は、大量の実験データを用いて学習され、膨大なメタゲノム・データベースからの共進化情報を組み込まれ、ディープニューラルネットワークを使用して、アミノ酸配列から基底状態のタンパク質構造を高精度で予測する。しかし、AF2を対象とする一連の研究から、デフォルトのAF2アルゴリズムは、タンパク質が取りうる多様なコンフォーメーションや配列変異の影響を予測する能力には限界があることが明らかにされてきた。フォールドスイッチング [fold switching: Structure 2021]や秩序-無秩序転移のような、異なるコンフォーメーションが関与する現象は、プロテオーム全体に遍在しており、多くの高分子の活性に直接結びついていることから、基底状態とは異なるコンフォーメーションを予測するツールは、基底状態を正確に予測する能力と同じくらい革命的である。

 さらに、複数のコンフォーメーションを迅速に予測可能とする手法は、より多くの創薬標的を発見し、創薬に革命をもたらす可能性がある。この可能性を完全に実現するためには、薬物受容体のコンフォメーションの平衡が薬物に対する親和性に直接関係してくることから、異なるコンフォメーション集団の相対的な比率を考慮する必要がある。例えば、イマチニブは癌原遺伝子とされるAbl1キナーゼに対して特異的なチロシン阻害剤であるが、その原因は酵素がイマチニブの認識とそれに続く誘導適合結合 (indued-fit binding) を容易にするコンフォメーションを著しく好むためであることが判明している。

 これまでに、AF2を利用してコンフォメーション変化を検出する手法がいくつか考案されてきた [Wayment-Steele HK et al. Nature 2024; Vani BP et al. J Chem Theory Comput 2023; Meller A et al. J Chem Theory Comput 2023; Stein R et al. PLOS Comput Biol 2022; del Alamo D et aleLife 2022]
従来、AF2では構造アンサンブルを予測できなかったが、Wayment-Steele HKらは、入力された大規模なマルチプル・シーケンス・アラインメント (MSA) をサブサンプリングし、予測数を増やすことで、同じ配列から生理学的に関連するさまざまなコンフォーメーションを捉えた構造アンサンブルが得られることを発見した。これらの予測は、コンフォーメーション空間の広い範囲と、予測された各状態の相対的なポピュレーションを探索する分子動力学 (MD) シミュレーションのシードとして使用可能である。こうして、基底状態のみを予測する段階からコンフォメーション変化の予測に向けて大幅にな改善が見られたが、こうした手法は、計算負荷が高い分子動力学 (MD) シミュレーションに依存している。

 研究チームは、主要なコンフォーメーションとその相対的割合をハイスループットで発見することが目的であれば、前述のMDシミュレーションのステップが不要である可能性を示した。例えば、目的のタンパク質の一連のオーソログや対立遺伝子のダイナミクスの違いを対比させるする場合などである。研究チームは、同じ進化系統に由来するタンパク質群が、それらの間の遺伝的距離と強く相関する相対的な状態集団の違いを持ちうること、また、AF2は共進化シグナルを解読することで機能するが、MSAをサブサンプリングすることで、同じタンパク質の異なるコンフォーメーションの正確な予測につながることが示唆されていたことから、AF2の手法にサブサンプリングを組み合わせることで、同じタンパク質が取りうるコンフォメーションのアンサンブルを、各コンフォメーションの相対的頻度も含めて推定可能と考えた。

 2024-03-29 14.47.40こうして、複数の配列アラインメントをサブサンプリングすることでタンパク質のコンフォーメーションのアンサンブルを生成する方法を考案し [Fig. 1引用右図参照]、Abl1チロシンキナーゼコアと顆粒球マクロファージコロニー刺激因子(GM-CSF)のコンフォーメーション分布における配列に起因する違いを予測するAF2の能力を系統的にテストした。Abl1とGM-CSFは、利用可能な配列データの量が大きく異なることから、選択した。これまでの研究とは異なり、最初の例として、SrcキナーゼからAbl1への進化系統における活性状態集団の変化を検出することに焦点を当て、状態分布を変化させることが知られている、あるいは疑われている一点変異や二点変異の影響を予測する能力をテストした。

  2024-03-29 14.54.42その結果、サブサンプリングAF2は、キナーゼコアの活性状態集団に対する変異のポジティブな影響とネガティブな影響の両方を、最大80%の精度で定性的に予測できることが判明した [Fig. 3引用右図参照]。また、AF2はキナーゼコアの活性から不活性への遷移における活性化ループの中間状態のほとんどを、MDシミュレーションで得られたものと同等のアンサンブルで予測できることが判明した。第二の例として、相同性がほとんど知られていないタンパク質であるGM-CSFの、点突然変異に応答したコンフォメーション・アンサンブルの変化を予測した。この予測結果は、実験的に決定されたNMRの結果と強い相関を示し、配列データが乏しい場合でも、サブサンプリングAF2が、コンフォメーション変化を予測可能なことを実証した。

 本研究は、生物物理学や創薬の分野に大きな影響を与える「タンパク質のコンフォメーション・アンサンブルの変化を予測する」というAF2の強力かつ未開発の機能の可能性を示した。