[crisp_bio感想: 久しぶりの'非-CRISPR & 非-新型コロナウイルス'論文]
[出典] "Improved protein structure refinement guided by deep learning based accuracy estimation" Hiranuma N, Park H, Baek M, Anishchenko I, Dauparas J, Baker D. (bioRxiv 2020-11-04) Nat Commun. 2021-02-26. https://doi.org/10.1038/s41467-021-21511-x
人工タンパク質の開発で知られるBaker研究室 [*]からの成果
[* crisp_bio 2021-03-09 David Barkerコレクション https://crisp-bio.blog.jp/archives/25781202.html 参照
アミノ酸の共進化データをベースとして残基間の距離を予測することで、タンパク質の構造予測法は長足の進歩を遂げたが、現実の構造に向けて、精密化 (refinement)が必要であった。このタンパク質構造精密化はこれまで有力だった手法は、低エネルギーの構造を探索する物理的な手法そしてまたは分子動力学であった。 研究グループは今回、天然アミノ酸配列や人工アミノ酸配列などから予測したタンパク質モデルの残基ごとの精度および残基間の符号付き距離の精度を算定する'DeepAccNet'を深層学習 (deep learning)をベースに開発し、Rosettaソフトウエア[https://www.rosettacommons.org/software]におけるタンパク質構造の精度向上を実現した。
- DeepAccNetは、原子レベルの局所的環境を評価するための3次元畳み込み (3D convolution)の上に、構造の大域的なコンテクストを見るための2次元畳み込み (2D convolution)を加えることで [Fig.1 引用右図参照]、似たようなタンパク質構造モデル予測プログラムを超えた。
- PDBから公開されているX線構造解析とクライオ電顕法により再構成された構造をモデルとしたDeepAccNetによる精度予測はそれぞれの分解能と相関した。DeepAccNetは、予測構造の精度と共に実験から得られた構造の精度の評価に有用であり、また、誤差が発生しやすい領域の特定にも有用である。
- 多段階からなるRosettaの構造リファインメントの各段階に、精度予測を組み込むことで、タンパク質構造モデルの精度が大幅に向上した。このことは、深層学習が、生体分子のエネルギー的に最も安定な構造を探索するに有効であることを示した。
[背景]
- 精密化における最大の課題は、一定のモデルから出発したとしても探索すべき構造候補数が膨大なことであり、一つには、探索空間の節約が試みられてきた。
- その中で、出発モデルにおいて誤差が生じやすい領域を特定し、誤差を抑制することで、探索空間を縮減可能があることから、モデルの精度を評価する (estimation of model accurary, EMA)手法が、開発されてきた。
- 例えば、深層学習をベースとするEMAとしてProQ3D [https://pubmed.ncbi.nlm.nih.gov/28052925/] , Ornate (Oriented Routed Neural network with Automatic Typing) [https://pubmed.ncbi.nlm.nih.gov/30874723/] , refineD [https://pubmed.ncbi.nlm.nih.gov/30759180/] など, 深層学習によらないVoroMQA [https://pubmed.ncbi.nlm.nih.gov/28263393/]が挙げられる。一方で、CASP13 (Critical Assessment of Techniques for Protein Structure Prediction 13 https://predictioncenter.org/casp13/)で最も成功を収めた精密化プロトコルは、これらに拠らない単純なアンサンブルをベースとした誤差算定による手法 (Heo & Feig, 2018らhttps://pubmed.ncbi.nlm.nih.gov/30530696/)とサンプリングに工夫を加えた手法 (Heo L, Arbou CF, Fei M, 2019 https://pubmed.ncbi.nlm.nih.gov/31197841/)であった。研究グループはこの状況は、これまでのEMAモデルのほとんどが、個々の残基の精度を評価するが、低精度の残基の空間的位置をどう改変すれば良いかという情報を提供していないことに由来すると判断した。
- DeepAccNetの特徴は、局所的な残基コンタクトの誤差に加えて、残基間の符号付き距離の誤差も対象として評価して点にある。
- [20201201更新] DeepMind、AlphaGo (囲碁)に続きAlphaFold (タンパク質折り畳み予測)でもトップへ - AlphaFold2. https://crisp-bio.blog.jp/archives/14057867.html
- 2020-09-26 多重な細胞表面抗原の組合せを認識し作動するタンパク質スイッチCo-LOCKRを開発, CAR-T細胞の高精度化も. https://crisp-bio.blog.jp/archives/24312687.html
- 2020-09-25 新型コロナウイルス: ピコモル親和性で結合し阻害するミニバインダーをデノボで創製. https://crisp-bio.blog.jp/archives/24296560.html
- 2020-08-26 タンパク質スイッチ'LOCKR'でCRISPRaを制御する. https://crisp-bio.blog.jp/archives/23992290.html
- 2020-07-27 標的分子に応答してコンフォメーションを変え発光する合成タンパク質製汎用バイオセンサー. https://crisp-bio.blog.jp/archives/23720557.html
- 2019-07-29 [NEWS] 生細胞内でスイッチとして機能するコンフォメーション可変タンパク質のデノボ合成 (2019-07-30補足). https://crisp-bio.blog.jp/archives/19096705.html
- 2019-07-22 タンパク質残基の共進化を手掛かりに、大腸菌と結核菌のタンパク質間相互作用をプロテオームワイドで同定. https://crisp-bio.blog.jp/archives/18988288.html
- 2019-05-20 環境変化に応じてコンフォメーションを変えるタンパク質をde novo合成. https://crisp-bio.blog.jp/archives/17736830.html
- 2019-01-14 Neoleukin-2/15:安定・安全・強力なIL-2/IL-15模倣分子をデザイン. https://crisp-bio.blog.jp/archives/14992041.html
- 2018-11-11 成長と分解の調節が可能な自己集合型タンパク質フィラメントをde novo設計. https://crisp-bio.blog.jp/archives/13467556.html
- 2018-09-17 蛍光性β-バレルのデノボ設計・発現・応用. https://crisp-bio.blog.jp/archives/12216197.html
- 2017-12-17 ドラッグデリバリー:ヌクレオカプシドの設計と進化. https://crisp-bio.blog.jp/archives/5772528.html
- 2017-11-01 広域中和抗体をミミックするペプチドでインフルエンザウイルスに対抗する. https://crisp-bio.blog.jp/archives/4792568.html
- 2017-10-05 共有結合を組込んだタンパク質デノボ設計:新奇3次元構造のメゾスコピックなタンパク質スキャフォールドを作出. https://crisp-bio.blog.jp/archives/4190019.html
- 2017-09-28 分子標的ミニタンパク質のデノボ設計・合成:インフルエンザヘマグルチニンとボツリヌス毒素. https://crisp-bio.blog.jp/archives/4051382.html
- 2017-07-18 データ駆動型タンパク質工学の始まり. https://crisp-bio.blog.jp/archives/2902191.html
コメント