crisp_bio

論文・記事紹介:CRISPR生物学・技術開発・応用 (ゲノム工学, エピゲノム工学, 代謝工学/遺伝子治療, 分子診断/進化, がん, 免疫, 老化, 育種 - 結果的に生物が関わる全分野); タンパク質工学;情報資源・生物資源;新型コロナウイルスの起源・ワクチン・後遺症;研究公正

1. 論文 "Design of intrinsically disordered protein variants with diverse structural properties" Pesce F [..] Lindorff-Larsen K. Sci Adv. 2024-08-28. https://doi.org/10.1126/sciadv.adm9926 [所属] U Copenhagen, St. Jude Children's Research Hospital, Illinois Institute of Technology

 天然変性タンパク質(intrinsically disordered proteins: IDP)は、生物学において広範な機能を担っており、IDPを設計することができれば、新しい機能を持つタンパク質のレパートリーを広げることができる可能性が示唆されている。しかし、IDPはダイナミックレンジが広く、構造が複雑であるため、特定のコンフォメーション特性を持つIDPを計算機で設計することは困難であった。

 デンマークと米国の研究チームが今回、特定の構造特性を持つIDPを設計するための一般的なアルゴリズムを報告した。コンパクション、長距離接触、相分離傾向の異なる、自然界に存在するIDPの変異体を生成することで、このアルゴリズムの性能を実証した。次に、設計を実験的に検証し、コンフォメーションを決定する配列の特徴を分析した。その結果が機械学習モデルによってどのように捉えられるかを示し、アルゴリズムの高速化を可能にした。

 本研究において、タンパク質の無秩序がもたらす多くの特性を利用した機能を持つタンパク質の設計が前進した。

2. FOCUS "Extending computational protein design to intrinsically disordered proteins" Robustelli P. Sci Adv. 2024-08-28. https://doi.org/10.1126/sciadv.adr3239 [所属] Dartmouth College

 構造生物学の分野は、歴史的に安定した3次元(3D)構造に折り畳まれるタンパク質や核酸の研究に焦点を当ててきた。タンパク質が細胞内でどのように機能するかについての現在の理解のほとんどは、「配列-構造-機能」の関係という概念に基づいている。すなわち、タンパク質のアミノ酸配列が、溶液中でどのような構造をとるかを決定し、それが生物学的機能を決定すると考えられている。しかし、真核生物に含まれるタンパク質の約30%は、安定した3次元構造には折り畳まれず、溶液中で急速に相互変換する構造の集合体(総称して 「コンフォメーション・アンサンブル / conformation ensembles 」と呼ばれる [*])を形成している。これらのダイナミックに形を変えるタンパク質は、「天然変性タンパク質」(intrinsically disordered proteins: IDPs)または 「天然変性領域」(intrinsically disordered regions: IDRs)と呼ばれる。IDPとIDR(IDRと総称される)は、「配列-構造-機能」のパラダイムに挑戦しながら、分子や細胞の機能において様々な重要な役割を果たしている [Nat Rev Mol Cell Biol, 2024 ]
[*] AlphaFold2を利用して、関心のあるタンパク質が取りうる一連のコンフォメーションのアンサンブルを予測する試みはなされている[crip_bio 2024-04-01]が、IDRの予測/設計には至っていない 

 IDPの細胞機能障害は、いくつかの神経変性疾患[アルツハイマー病、パーキンソン病、筋萎縮性側索硬化症(ALS)]や多くの癌に関与している [Curr Opin Chem Biol, 2021]。IDRは、自己会合して生体分子凝縮体を形成し、細胞内で多様な膜なしオルガネラ(membrane-less organelle)を生成する能力を持つ。この性質は、細胞生物学や疾患において重要であることがますます認識されるようになっている。生物学とヒトの病気についてより完全な理解を得るためには、構造生物学は、安定した3次元構造を持つタンパク質の研究にとどまらず、IDRの配列が溶液中でどのような形をとるか、そしてこの分布が細胞内での機能や病気における機能障害をどのように規定するかを説明するルールを開発しなければならない。

 IDRのコンフォーメーション・アンサンブルは極めて不均一であり、単一の参照構造や少数の実質的に発現しているコンフォーメーションとの関係で分類することはできない。IDRは安定な折りたたみ状態を持たないことで定義されるが、完全に「非構造 / unstructured」なわけではない。IDRアンサンブルは、特定のペプチド骨格の二面角や一時的に発現する二次構造要素の高い集団という形で、局所的な秩序を含んでいる。また、一過性の長距離三次接触や動的な疎水性コアという形で、グローバルな秩序も含まれている。これらのコンフォメーションの偏りが、IDRアンサンブルの全体的なサイズと形状、溶液環境の変化に対する応答、他のタンパク質との相互作用の傾向、そして最終的には生物学的機能を決定する。したがって、折り畳まれたタンパク質が「配列-構造-機能」の関係によって記述されるのに対して、IDRは「配列-アンサンブル-機能」の関係によって記述される。

 Protein Data Bankに蓄積された膨大な構造情報(約20万個の原子分解能タンパク質構造と、数十億個の既知タンパク質配列)へのアクセスは、折りたたみタンパク質の「配列-構造」の関係の深い理解を促し、AlphaFoldに象徴される、プロテオームスケールでタンパク質配列から正確な立体構造を予測する能力の最近の進歩をもたらした。対照的に、IDRの一般的な配列-立体構造の関係を解明することは、困難な課題であった。IDRの配列は折り畳まれたタンパク質に比べて保存性が低く、実験的研究によって明らかにされたのは、比較的少数のIDRの「配列-立体構造」の関係のみであった。実験的に検証されたIDRの原子分解能コンフォーメーション・アンサンブルは、まだ比較的希なことから、 アンサンブル平均化された生物物理学的測定を利用して正確な構造アンサンブルを作成するには、実験データに高度な分子シミュレーション手法を組み合わせる必要がある。 

 その中で、分子シミュレーションの進歩により最近、IDRの「配列-アンサンブル-機能」の関係を定量的に理解する道が開けてきた。分子シミュレーションでは、分子内の原子(または原子の集まり)間の力を記述し、コンフォメーション・アンサンブルを生成するために物理モデルが用いられる。物理モデルは、さまざまなレベルの空間分解能で構築することができるが、CALVADOSモデル [PNAS, 2021]のような、個々のアミノ酸を単一粒子として表現する計算効率の高い粗視化( coarse-grained: CG)モデルは、IDRのアンサンブルをモデル化するのに適している。CALVADOSモデルのパラメータは、IDR内の長距離三次相互作用について報告されている実験データや、IDRの全体的なコンパクションについて報告されている実験データとの一致を最大にするように最適化された。一本鎖IDRの実験データを用いて導出されたCALVADOSパラメータは、IDRの自己会合と液液相分離(liquid-liquid phase separation: LLPS)の傾向を見事に予測した。このことは、比較的少数の実験データを用いて微調整した単純なモデルが、IDR相互作用の基礎となる物理を驚くほどよく捉えていることを示唆している。

 画期的な研究として、Teseiら [Nature, 2024] は、CALVADOSモデルをヒトプロテオームから28,058個のIDRのコンフォメーションアンサンブルを計算するために適用し、IDRの「配列-アンサンブル-機能」の関係をこれまでにないスケールで特徴付けることを可能にした。この研究により、IDRのコンパクションと細胞内局在および機能との相関が明らかになり、ヒトIDRの配列、そのグローバルな特性、細胞内での挙動をロバストに解析できるようになった。Teseiらはまた、このデータセットを用いて、配列からIDRアンサンブルのサイズと形状を直接予測する機械学習モデルを訓練し、このモデルを応用して、進化的オーソログ間およびIDR疾患変異体間でのこれらの特性の保存性を研究した。同時に、Lotthammerら [Nat Methods, 2024]は、IDRのアンサンブル特性を予測する深層学習モデルをトレーニングするために、ハイスループットの粗視化シミュレーションを使用し、プロテオーム内およびプロテオーム間のIDRアンサンブルの分散を特徴付けるために、このモデルを適用した。これらの研究は、IDRのコンフォメーション・アンサンブルの構造記述を使って、IDRの進化や細胞機能についての洞察を得ることが可能になりつつあることを示しており、IDRの「配列-アンサンブル-機能」の関係の理解において重要な進歩を示している。

 タンパク質設計とは、アミノ酸配列を操作することによって、特定の性質や機能を持つ新しいタンパク質を作り出すプロセスであり、「タンパク質-構造-機能」の関係についての理解が厳しく問われる課題である。近年、アミノ酸配列から折りたたみタンパク質の立体構造を予測する能力が向上し、それに伴って新規タンパク質をデザインするための強力な技術が開発された [Nature, 2023]。これに対して、Pesceら [Sci Adv, 2024]が、CALVADOSシミュレーションモデルのスピードと精度を利用して、望ましい特性を持つコンフォメーション・アンサンブルを作り出すIDR配列を設計した。

 Pesceらは、CALVADOSを使って初期IDR配列のアンサンブルを生成し、新しいIDR配列の目標とするアンサンブル特性(望ましいコンパクションのレベルや長距離接触の集団など)を定義する。その後、CALVADOSエネルギー関数または追加のCALVADOSシミュレーションのいずれかを使用して、提案された突然変異の導入により生成されたIDRアンサンブルがどのように変化するかを予測する。IDR提案された変異は、モンテカルロ・シミュレーションを用いて、初期配列が徐々に望ましいアンサンブル特性を持つ新しい配列に進化するように、受け入れられるかまたは拒否される [Figure 1引用右図参照]

 Pesceらは、提案した設計アルゴリズムを用いて、全体の配列組成を一定に保ちながら、自然に発生するIDPのコンパクションの程度を調整できることを示した。彼らは、異なる配列組成と特性を持つ4つのIDPの拡張されたアンサンブルと圧縮されたアンサンブルを設計し、そのアルゴリズムが「配列-アンサンブル」空間の大規模な探索を可能にすることを実証した。各タンパク質において、展開と圧縮を促進する配列パターン特徴を定量化し、微妙な違いを明らかにした。あるIDPについて、PesceらはX線小角散乱測定により、設計されたいくつかの配列の予測されたアンサンブルのサイズを検証し、設計された配列がLLPSを受ける傾向をシミュレートし、実験的に測定されたLLPSの傾向と良く一致することを確認した。発表された最初の例では、Pesceらは、アミノ酸の位置を入れ替える突然変異のみを用いて、固定された配列組成を持つIDRアンサンブルの特性を変えるという困難な問題に焦点を当てている。提示された設計アルゴリズムは非常に柔軟であり、IDRの他の構造的性質をターゲットにしたり、配列空間におけるより大きな変化をサンプリングしたりするために適応することができる。

 正確で計算効率の高い分子シミュレーションモデルにより、IDRの「配列-アンサンブル-機能」の関係についての理解が急速に進んでいる。以前は、タンパク質の設計は主に折り畳みタンパク質の領域に限られていた。Pesceらの研究は、IDRシミュレーションの進歩を利用して、計算によるタンパク質設計をIDRの領域にまで拡大し、望ましい構造特性を持つ新しいIDR配列を合理的に設計することが可能なことを示した
このエントリーをはてなブックマークに追加

コメント

コメントフォーム
評価する
  • 1
  • 2
  • 3
  • 4
  • 5
  • リセット
  • 1
  • 2
  • 3
  • 4
  • 5
  • リセット