2022-09-28 記事タイトルを「深層学習で幻視した対称構造を持つホモオリゴマータンパク質7種類の結晶化 - 最大1550残基とC33対称性を持つ10ナノメートルの巨大リング構造 [*]-」へと改訂 [旧タイトル:David Bakerら、AlphaFold2を利用した環状タンパク質のデノボ設計関連の論文2報を発表] [*] PDBj公開EMD-27660から引用した右図参照
[注] 本記事関連crisp_bio記事: 「タンパク質フォールディング問題を解く: より易く,より速く」の中の「2022-09-20 [ニュース] 研究者がAIを利用して、画期的なタンパク質を創出し始めた」の項
1. AIで幻視した対称的なタンパク質オリゴマーの発現に成功し、構造を決定
1. AIで幻視した対称的なタンパク質オリゴマーの発現に成功し、構造を決定
[出典] "Hallucinating symmetric protein assemblies" Wicky BIM, Milles LF, Courbet A [..] Baker D. Science 2022-09-15. https://doi.org/10.1126/science.add1964 [著者所属] University of Washington, HHMI.
深層生成モデルのアプローチは、天然タンパク質の配列と構造を超えた広大なタンパク質構造の空間を探索可能とする。David Bakerが率いる研究チームは今回、プロトマーの構造の事前指定や実験的検証をすることなく、プロトマーの数 (N)とプロトマーの長さ (L)を指定するだけで、深層 (ディープ)ネットワークによる幻視 (hallucination) [注]を利用して、多様な対称的タンパク質ホモオリゴマーを生成することに成功した。
当初、ランダムな配列から出発してモンテカルロ法で配列空間を探索し、N重の配列をAlphaFold2ネットワークを介してpLDDT (per-residue structural accuracy)とpTM (周期対照性の指標を伴うan estimate of the TM score)で評価し、天然タンパク質には見られない構造(以下、HALs) 150種類について、大腸菌で発現させたが、可溶性を示す構造がほとんど得られなかった。また、僅かに可溶性を示した構造は、目的とした環状構造を示さなかった。
研究チームは、この原因が、モンテカルロ法 (Markov chain Monte Carlo (MCMC))による最適化における過剰適合にあるとし、最近開発したProteinMPNN (次項参照) 配列設計用ニューラルネットワークを利用して、HALの主鎖用の配列を生成した。
ProteinMPNNを利用して設計した96種類のタンパク質を評価し、そのうち19種類の設計を結晶化に供し、7種類のタンパク質の構造解析に成功した (C2 3種類, C3 2種類, C4 2種類)
7種類の結晶構造は計算モデルと非常に近く(RMSDの中央値:0.6Å)、最大1550残基とC33対称性を持つ10ナノメートルの巨大リングの3つのクライオ電顕構造は、これまでに知られていた構造とかけ離れた完全にオリジナルの構造であった。
この結果は、深層学習を用いて生成できる新しいタンパク質構造の多様性を示すものであり、ナノマシンやバイオマテリアルの複雑化する構成要素の設計に道を開くものである。
[注] Hallucination: ディープネットワークによる幻視を介したデノボタンパク質設計
[注] Hallucination: ディープネットワークによる幻視を介したデノボタンパク質設計
- "De novo protein design by deep network hallucination" Anishchenko I, Pellock SJ [..] Baker D. Nature 2021-12-01. https://doi.org/10.1038/s41586-021-04184-w
[参考図とデータ入手先]
- Fig. 4. Cryo-electron and negative stain electron microscopy validation of large HALs. https://www.science.org/cms/10.1126/science.add1964/asset/02a2d943-e668-4bdb-b97c-6cd75700538b/assets/images/large/science.add1964-f4.jpg
- 本研究における全てのタンパク質情報、実験データ、設計モデル、スクリプトおよび計算方法を含むデータフレームはGitHubのhttps://github.com/bwicky/oligomer_hallucinationで公開
- 創出した分子の結晶学的データはPDB (8D06, 8D07, 8D08, 8D09)から、EMマップはEMDB (EMD-27658, EMD-27659, EMD- 27660)から公開
2. ProteinMPNNを用いたディープラーニングによるロバストなタンパク質配列設計
[出典] "Robust deep learning–based protein sequence design using ProteinMPNN" Dauparas J [..] Baker D. Science 2022-09-15. https://doi.org/10.1126/science.add2187 [著者所属] University of Washington, Wageningen University and Research, Lawrence Berkeley LaboratoryAmazon
深層学習はタンパク質構造予測に革命をもたらしたが、実験的に特徴づけられたほとんどすべてのde novoタンパク質設計は、Rosettaなどの、深層学習に依存しない物理ベースのアプローチで生成されてきた。David Bakerが率いる研究チームは今回、インシリコと実験の両方で優れた性能を持つ、深層学習ベースのタンパク質配列設計法、ProteinMPNNを開発した。
ネイティブなタンパク質主鎖において、Rosettaの32.9%に対し、ProteinMPNNは52.4%の配列回収率を示した。また、ProteinMPNNでは異なる位置のアミノ酸配列を、単一または複数の鎖の間で結合することができ、現在のタンパク質設計の幅広い課題に適用することが可能である。
研究チームは、RosettaやAlphaFoldを用いたタンパク質単量体、環状ホモオリゴマー、四面体ナノ粒子、標的結合タンパク質の設計で失敗したものを救うことで、X線結晶学、クライオ電顕法、および機能解析を用いてProteinMPNNの幅広い有用性と高精度を実証した。
コメント