2023-08-18 引用文献2の概要を追記
2023-08-17 Research Highlight 記事の書誌情報と概要を追記:"Diffusion model expands RoseTTAFold's power" Fudge JB. Nat Biotechnol. 2023-08-11.
David Bakerらは、画像解析で成功を収めてきた拡散モデルを、RoseTTAFold法に加えることで、複雑なタンパク質骨格のデノボ設計を可能にし、特定の対称性を持つ高次構造の生成を実現し、さらに、生成構造からアミノ酸配列を予測可能とした。この手法により、最大600アミノ酸残基からなるタンパク質を作成し、実験的に検証可能であり、事実、インフルエンザウイルスのヘマグルチニンタンパク質に結合するタンパク質については、クライオ電顕により原子レベルの精度が確認された。RFdiffusionは、治療用の生物製剤の開発を加速し、タンパク質と核酸、および、タンパク質とリガンドの相互作用の解明に有用である。
2023-07-17 Nature 誌刊行論文の書誌情報とタンパク質結合タンパク質デノボ設計の詳細を追記 (bioRxiv投稿から論文タイトルが大きく改訂されたが、アブストラクト以下に大きな改訂はないように思われる):"De novo design of protein structure and function with RFdiffusion" Watson JL, Juergens D, Bennett NR, Trippe BL, Yim J [..] Baker D. Nature 2023-07-11. https://doi.org/10.1038/s41586-023-06415-8;Baker研究室Webサイト掲載解説記事 2023-07-11.
2022-12-07 Baker研究室から公開されていたbioRxiv. 2022-12-10の投稿に準拠した初稿
[出典] "Broadly applicable and accurate protein design by integrating structure prediction networks and diffusion generative models" Watson JL, Juergens D, Bennett NR, Trippe BL, Yim J [..] Baker D. Preprint from Baker Lab. https://www.bakerlab.org/wp-content/uploads/2022/11/Diffusion_preprint_12012022.pdf [著者所属] U Washington, Columbia U, MIT, Seoul National U, HHMI.
2023-08-17 Research Highlight 記事の書誌情報と概要を追記:"Diffusion model expands RoseTTAFold's power" Fudge JB. Nat Biotechnol. 2023-08-11.
David Bakerらは、画像解析で成功を収めてきた拡散モデルを、RoseTTAFold法に加えることで、複雑なタンパク質骨格のデノボ設計を可能にし、特定の対称性を持つ高次構造の生成を実現し、さらに、生成構造からアミノ酸配列を予測可能とした。この手法により、最大600アミノ酸残基からなるタンパク質を作成し、実験的に検証可能であり、事実、インフルエンザウイルスのヘマグルチニンタンパク質に結合するタンパク質については、クライオ電顕により原子レベルの精度が確認された。RFdiffusionは、治療用の生物製剤の開発を加速し、タンパク質と核酸、および、タンパク質とリガンドの相互作用の解明に有用である。
2023-07-17 Nature 誌刊行論文の書誌情報とタンパク質結合タンパク質デノボ設計の詳細を追記 (bioRxiv投稿から論文タイトルが大きく改訂されたが、アブストラクト以下に大きな改訂はないように思われる):"De novo design of protein structure and function with RFdiffusion" Watson JL, Juergens D, Bennett NR, Trippe BL, Yim J [..] Baker D. Nature 2023-07-11. https://doi.org/10.1038/s41586-023-06415-8;Baker研究室Webサイト掲載解説記事 2023-07-11.
2022-12-07 Baker研究室から公開されていたbioRxiv. 2022-12-10の投稿に準拠した初稿
[出典] "Broadly applicable and accurate protein design by integrating structure prediction networks and diffusion generative models" Watson JL, Juergens D, Bennett NR, Trippe BL, Yim J [..] Baker D. Preprint from Baker Lab. https://www.bakerlab.org/wp-content/uploads/2022/11/Diffusion_preprint_12012022.pdf [著者所属] U Washington, Columbia U, MIT, Seoul National U, HHMI.
タンパク質工学において近年、深層学習手法が、配列、機能部位のスキャフォールド、新しいモノマー、環状オリゴマー、および抗体ループの設計にかなりの可能性を示してきた。しかし、標的分子に結合するバインダーのde novo 設計や対称性の高いタンパク質の設計を含む幅広い設計を実現できる一般的なフレームワークは未だ登場していない。
画像生成や言語生成のモデリングで大成功を収めた拡散モデル (diffusion model)も、タンパク質モノマー生成に適用されたが、タンパク質設計における成功は限定的であった。これは、タンパク質の主鎖の幾何学的構造の複雑さや配列と構造のと関係の複雑さがもたらしたものと考えられる。
David Bakerらは今回、強力な構造予測手法を拡散ノイズ除去ネットワーク(diffusion denoising networks)として利用することで、拡散モデルが学習したタンパク質表現を活用できることを示した。すなわち、無条件およびトポロジー制約のあるタンパク質モノマーの設計、タンパク質およびペプチドのバインダー設計、対称性オリゴマーの設計、酵素活性部位のスキャフォールドの設計、治療および金属結合タンパク質の設計のための対称性モチーフ・スキャフォールドの設計に、利用可能なことを示した。
RoseTTAFold Diffusion (RFdiffusion) と命名したこの手法の性能と汎用性を、何百もの新しい設計を実験的に特徴づけることによって実証した。そのハイライトとして、副甲状腺ホルモンに対してピコモルの結合親和性を示すバインダーの設計の際に、実験的に最適化する前に、計算機で設計した結合性よりもかなり高い親和性を示したこと、また、これまで観察されなかった一連の対称的な集合体を電子顕微鏡で実験的に確認されたこと、を挙げる事ができる。
RFdiffusionは、大成功を収めた「ユーザーが指定した入力から画像を生成するネットワーク」を彷彿とさせるように、単純な分子仕様から多様で複雑なタンパク質構造や機能を設計することを可能にする。
[補足] タンパク質結合タンパク質 (バインダー) の設計
標的タンパク質に高親和性で結合するタンパク質 (バインダー)の設計は、創薬に貢献するタンパク質設計のグランドチャレンジである。Bakerらは、バインダーのデノボ設計が、従来のRosetta法で可能なこと [*1]、続いて、ProteinMPNNによる配列設計とAF2による設計のフィルタリングを組み合わせることでより設計の成功率を高められること [*2] を示してきたが、実験で活性を示す結晶を得るためには、数千の設計を検証する必要があった。また、タンパク質スキャフォールドの特定のセットを予め選択するところから設計が出発するアプローチであったがゆえに、候補の多様性が限定的であった。Bakerらが知る限りでは、深層学習を利用して任意のバインダーに対して完全にデノボで設計可能にした例はまだない。
[補足] タンパク質結合タンパク質 (バインダー) の設計
標的タンパク質に高親和性で結合するタンパク質 (バインダー)の設計は、創薬に貢献するタンパク質設計のグランドチャレンジである。Bakerらは、バインダーのデノボ設計が、従来のRosetta法で可能なこと [*1]、続いて、ProteinMPNNによる配列設計とAF2による設計のフィルタリングを組み合わせることでより設計の成功率を高められること [*2] を示してきたが、実験で活性を示す結晶を得るためには、数千の設計を検証する必要があった。また、タンパク質スキャフォールドの特定のセットを予め選択するところから設計が出発するアプローチであったがゆえに、候補の多様性が限定的であった。Bakerらが知る限りでは、深層学習を利用して任意のバインダーに対して完全にデノボで設計可能にした例はまだない。
Bakerらは今回、RFdiffusionによって、インフルエンザA H1 ヘマグルチニン (HA)、インターロイキン-7受容体 (IL-7Rα)、PD-L1、イスリン受容体、およびトロポミオシン受容体キナーゼ A (TrkA) に対するバインダーをデノボ設計し、AF2の信頼指標でフィルタリングし、それぞれ95の候補設計について、大腸菌で発現・精製し、10μM濃度でのバイオレイヤー干渉法 (BLI) アッセイで、〜19%の成功率を得た。これはRosettaをベースとする設計の200倍 (数千の設計に対して~100の設計) の成功率にあたる。BLIから得られた親和性はナノモルのレベルであり、HAとIL-7Rαでは~30 nMであった。HAバインダー (HA_20) については、クライオ電顕法で再構成したIowa43 HAとの複合体構造が、設計モデルとほぼ完全に一致することを確認した [PDB 8SK7/EMDB-40558:Cryo-EM structure of designed Influenza HA binder, HA_20, bound to Influenza HA (Strain: Iowa43). 分解能 2.93 Å]
[*] 引用文献
[*] 引用文献
- "Design of protein-binding proteins from the target structure alone" Cao L, Coventry B [..] Baker D. Nature 2022-03-24. https://doi.org/10.1038/s41586-022-04654-9
- "Improving de novo protein binder design with deep learning" Bennett NR, Coventry B [..] Baker D. Nat Commun. 2023-05-06. https://doi.org/10.1038/s41467-023-38328-5;ターゲットの構造情報のみから、高アフィニティー蛋白質結合蛋白質をデノボで設計できるようになってきた。しかし、全体的な設計成功率が低いため、改善の余地がかなりある。ここでは、深層学習を用いたエネルギーベースのタンパク質結合体設計の改善について検討した。
AlphaFold2またはRoseTTAFoldを用いて、設計された配列が設計されたモノマー構造を採用する確率と、この構造が設計通りにターゲットと結合する確率を評価することで [Fig.1引用右図のモデル図参照]、設計成功率が10倍近く向上することを発見した。さらに、RosettaではなくProteinMPNN [Scaffolding protein functional sites using deep learning. Sicence 2022-07-21]を用いた配列設計によって、計算効率が大幅に向上した。
コメント