crisp_bio

科学分野の比較的新しい論文と記事を記録しておくサイト: 主に、CRISPR生物学・技術開発・応用 (ゲノム編集, エピゲノム編集, 遺伝子治療, 分子診断/代謝工学, 合成生物学/進化, がん, 免疫, 老化, 育種 - 結果的に生物が関わる全分野) の観点から選択し、時折、タンパク質工学、情報資源・生物資源、新型コロナウイルスの起源・ワクチン・後遺症、機械学習・AIや研究公正からも選択

 ドメイン挿入エンジニアリングは、自然界では互いに独立した生物学的機能を発揮している天然のタンパク質を構成するドメインを組み合わせて再配置することで、自然界に存在しない活性を帯びたタンパク質を生み出すことができる [Fig. 1一部引用右下図 a 参照]ProDomino Fig. 1 ハイデルベルグ大学の研究チームは今回、ドメイン組換えを合理的に行う機械学習パイプラインであるProDominoprotein domain insertion optimizer)を開発・検証した。
  • ProDominoは、自然発生的なドメイン内挿入イベントから得られた半合成タンパク質配列データセット  [先の引用図の b 参照 ] を用いた学習をベースに構築された。
  • ProDominoを介して、バイオテクノロジー関連タンパク質におけるドメイン挿入部位が堅牢に特定され、大腸菌およびヒト細胞を用いて実験的に検証した。
  • 具体的に、光および低分子で制御可能な受容体ドメインを挿入し、強力な単一成分光遺伝学的および化学遺伝学的タンパク質スイッチをモデルに基づいて迅速に作成できることを実証した。これらには、ヒト細胞においてゲノム編集を誘導可能な新規なCRISPR-Cas9バリアントCas12aバリアントが含まれる。
  • ここで確立されたワンショット・ドメイン挿入エンジニアリングの手法は、カスタマイズされたアロステリック・タンパク質の設計を大幅に加速する。
[詳細]

 ドメインは、タンパク質の構造的および機能的なサブユニットである。既存のドメインを新しい組み合わせて再配置することは、タンパク質進化の源泉である。個々のドメインは定義上、構造的および機能的に保存されているが、自然界では多様なタンパク質に内在している。

 タンパク質ドメインの人工的な組み換えは、自然界には見られない特性を持つ新規タンパク質を設計するための強力な方法であることが証明されている。効果的な機能的結合を実現するには、自然界では互いに独立な2つドメインの物理的接続だけでなく、あるドメインを別のドメインの特定の部位に挿入するドメイン挿入エンジニアリングが特に強力である。融合ドメインは融合ドメインは構造的および機能的に緊密な共依存関係を持つことになる。

 ドメイン挿入エンジニアリングは、高感度バイオセンサーや新規分子機械の開発に大きな可能性を秘めており、その好例が、人工的に設計されたアロステリック・タンパク質スイッチである。より具体的には、光受容体ドメインまたはリガンド結合ドメインを任意のエフェクター・タンパク質に挿入することで、光または低分子によって活性が制御されるスイッチ可能なタンパク質が得られる。このような場合、トリガーを介した受容体ドメインの構造変化が受容体タンパク質に伝播し、それによって受容体タンパク質が活性化または不活性化される。

 しかし、アロステリックタンパク質エフェクターの創製には、エフェクタータンパク質における適切なドメイン挿入部位の特定が困難であることが障害になっている。一つには、単純なドメイン挿入は通常、挿入ドメインとエフェタータンパク質の一方または双方の構造的・機能的完全性を恒久的に損なう可能性が高い。もう一つには、ドメイン挿入を許容する部位は少数であるが、挿入ドメインの種類は極めて多種多様であり、それらの挿入の実行可能性や効果を合理的に推論することや計算することが困難である。

 タンパク質の表面に露出している柔軟なループは、しばしば有望な挿入部位と考えられているが、実験的スクリーニングの結果、これらのループのうち実際にドメインの組み込みを許容するのはごく一部であり、一方で、二次構造要素がドメインの挿入を極めて良好に受け入れる場合があることが示されている。最後に、単純な表面露出ルーへの挿入が実現したとしても、天然の細胞環境においてタンパク質の活性を付与するコンフォメーションのアンサンブルと構造的特徴に関する理解が不足していることが多いことから、必ずしも想定していた機能が得られるとは限らない。

 ドメイン融合に適した部位を特定するには、基礎となるデータが決定的に不足している。実験的なドメイン挿入データセットは生成が煩雑で、存在するタンパク質も限られているからである。多くの研究チームがこれまで、入手可能な挿入変異データセットを利用してランダムフォレストなどの機械学習アルゴリズムに基づくのモデルを構築してきたが、一般化には至らず、ドメイン挿入エンジニアリングのツールになり得なかった。一方で近年、タンパク質言語モデルによって、豊富な特徴表現に基づいてタンパク質構造や機能特性を正確に予測できるようになりタンパク質工学が革新された。、様々なタンパク質工学および設計タスク20,21に効果的に適用されてきました。しかしながら、ここでも、言語モデルをドメイン挿入エンジニアリングに展開するには、質量ともにデータが不十分であった。

 ドイツの研究チームは、ドメイン挿入エンジニアリングにおける機械学習モデルの開発に向けて、まず、データ生成に取り組んだ。すなわち、まばらな実験データに頼るのではなく、自然に発生するドメイン内挿入イベントに着想を得た半合成配列からなる大規模なタンパク質データセットを構築した。この多様なデータセットにより、エフェクター・タンパク質におけるドメイン挿入部位を予測する強力なモデルである ProDomino (タンパク質ドメイン挿入最適化ツール) をトレーニングする(学習させる)ことが可能になった。ESM-2(Evolutionary Scale Modeling-2)由来のタンパク質配列表現をモデル入力として使用し、マスキング戦略と組み合わせて、パイプラインの感度と選択性を微調整することで、トレーニングデータとは進化的に無関係なタンパク質における挿入部位の正確な予測を実現した。

 ProDomino を適用することで、大腸菌およびヒト細胞を用いた実験で検証された約 80% の成功率で、いくつかのタンパク質の挿入部位を推定した。最後に、青色光または化学誘導物質に反応する受容体ドメインを挿入することで、バイオテクノロジーおよび生物医学的関連のあるいくつかの切り替え可能なエフェクタータンパク質の直接的なモデルベース・エンジニアリングを実証した。

[光遺伝学的および化学遺伝学的CRISPRゲノムエディターの開発]
  • ProDominoを利用してSpCas9への挿入部位を予測し、以前に報告された実験的なトランスポゾン挿入データセットと比較した。両者のの間には、AUROCが0.71とかなり重複しているにもかかわらず、ProDominoは、以前に発表されたデータセットの上位ヒットには含まれていない挿入スコアの高い部位をいくつか予測した。そこで、触媒活性を失活させたdCas9の上でこれらの部位のうち4箇所に光受容体AsLOV2を挿入し、HEK293T細胞において発現させルシフェラーゼアッセイを実施し、活性を確認した。
  • Moraxella bovoculi Cas12b (MbCas12b) についてもProCominoを利用することで、これまで作成が困難であった光応答性または臨床的に関連する薬剤応答性を発揮するリガンド活性化単鎖Cas12aスイッチの創製に成功した。
[出典] "Rational engineering of allosteric protein switches by in silico prediction of domain insertion sites" Wolf B [..] Mathony J, Niopek D. Nat Methods. 2025-08-04. https://doi.org/10.1038/s41592-025-02741-z [所属機関] Heidelberg University, Technical University of Darmstadt, Zuse School ELIZA
このエントリーをはてなブックマークに追加

コメント

コメントフォーム
評価する
  • 1
  • 2
  • 3
  • 4
  • 5
  • リセット
  • 1
  • 2
  • 3
  • 4
  • 5
  • リセット