crisp_bio

科学分野の比較的新しい論文と記事を記録しておくサイト: 主に、CRISPR生物学・技術開発・応用 (ゲノム編集, エピゲノム編集, 遺伝子治療, 分子診断/代謝工学, 合成生物学/進化, がん, 免疫, 老化, 育種 - 結果的に生物が関わる全分野) の観点から選択し、時折、タンパク質工学、情報資源・生物資源、新型コロナウイルスの起源・ワクチン・後遺症、機械学習・AIや研究公正からも選択

2015-09-10 冊子体出版書誌情報を追記:Nat Biotechnol 43, 1266–1273 (2025)
2014-10-17 オンライン出版論文に準拠した初稿
[出典] "Model-directed generation of artificial CRISPR–Cas13a guide RNA sequences improves nucleic acid detection" Mantena S [..] Sabeti PC, Metsky HC. Nat Biotechnol. 2024-10-11/2025 Aug. https://doi.org/10.1038/s41587-024-02422-w [所属] Broad Institute, Harvard U, HMS, Harvard T.H. Chan School of Public Health, Princeton U, HHMI

 CRISPRガイドRNA配列は、原核生物の天然配列から正確に誘導されたものであり、すべての用途において最適に機能するとは限らない。米国の研究チームが今回、CRISPR Dxへに向けて、天然配列に複数のミスマッチを持たせることで、最大限に適合する人工CRISPR-Cas13aガイドを設計するための生成アルゴリズムを実装し、評価した。

 ここで得られたガイドRNAは、天然配列に直接由来するガイドRNAと比較して、多様な病原体の高感度な検出と病原体バリアントの識別を可能にした。また、本研究において、Cas13aのターゲティングを拡大する設計原理が明らかになった。

[詳細]

 感染性病原体のアッセイ法を一変させたCRISPR Dxの性能は、Casエフェクターを標的核酸に誘導するガイドRNA配列(診断用オリゴヌクレオチド配列)に決定的に依存している。高性能なガイドRNAはこれまで、原核生物由来の天然ガイドRNA配列から直接あるいはコンセンサス配列などをベースに機械学習や熱力学的ヒューリスティックを介して選択されてきたが、入力である天然配列と同一またはほぼ同一であった。しかし、天然の診断用ガイド配列がすべての用途で最高の性能を発揮するとは限らない。標的配列に対していくつかのミスマッチを帯びた人工配列が、天然配列よりも優れた診断活性を達成する可能性がある。近年、生成的なアプローチが、アミノ酸配列からのタンパク質構造予測や、合成DNA調節エレメントの設計に利用されているが、ガイドRNAの設計には展開されてこなかった。

 米国の研究チームは今回、人工ガイドRNA配列を構築するために生成的設計アプローチを利用することで、多様な検出タスクの性能を向上させることができると考えた。例えば、遺伝的に多様な病原体の全形態を検出するタスク(マルチターゲット検出)、有効な標的領域に複数の多型がある病原体を検出するタスク、に対して、人工ガイドRNA配列は、ある特定の組み合わせに完全に一致する配列よりも、すべての多型の組み合わせをより高感度に検出することができる [Figure 1 a 参照]。あるいは、一塩基多型(SNP)の違いであっても、非常によく似た2つの標的を区別する(バリアントの同定)ことが目的であれば、ミスマッチを最適な位置に配置した人工ガイドRNA配列は、1つの標的と同一の配列よりも高い特異性を達成できる [Fig. 2  a 参照]。これにより、病原体の変異をより正確に同定したり、病原体の系統を識別したりすることが可能になる。これまでの研究では [*1]、診断用オリゴヌクレオチド配列に手作業で特異性を高めるミスマッチを導入するヒューリスティックな規則について述べているが、これらの戦略はオーダーメイドであり、識別できる変異に限界があった 。

 本研究では、要最小限の設備と低資源環境での使いやすさから、POCT(ポイントオブケア検査)のツールとしてますます注目を集めている「CRISPR-Cas13aのトランス切断活性をベースにする検出アッセイで使用するガイドRNAの設計」に焦点を当てた。具体的には、人工的な28 nt CRISPRガイドRNAスペーサー配列の設計を目指した。

 先行研究 [*2]、にて、研究チームは、畳み込みニューラルネットワーク(CNN)を識別モデルとして用いて、Activity-informed Design with All-inclusive Patrolling of Targets (ADAPT) を開発していた。
[*2] "Designing sensitive viral diagnostics with machine learning" Metsky HC, Welch NL, Pillai PP. Nat Biotechnol 2022-03-03.

 ADAPTは、天然の配列(一連の配列のコンセンサス配列)の中から選択することにより診断ガイドを設計するものである。すなわち、ADAPTは予め決められた配列リストの中から候補ガイドRNAを選択するため、天然配列から数ミスマッチ以上離れたガイドを設計することはできず、バリアント同定のためのガイドを一塩基分解能まで設計することもできない。また、ガイド設計を最適化する新しい戦略を発見することもできない。対照的に、人工的なガイド配列を生成するアルゴリズムは、これらの目標を達成すると同時に、特に感染症における課題に対して、優れた診断感度と特異性を可能にする。

 人工ガイド配列を生成するためには、膨大なRNA配列の高次元空間を探索する必要がある。各ガイドは、マルチターゲット検出やバリアント同定のような、それぞれの課題に応じた適合度を持つ。適合度の高い人工ガイド配列は、配列空間上、標的の相補配列に近いはずであるが、この領域は約107-109配列 と十分に大きく [Supplementary Note 1参照] 、配列空間を効率的に探索するアルゴリズムの開発の動機となる。

 そこで、人工的なCRISPR-Cas13aガイドRNAを設計するための2種類のアルゴリズムを実装し、評価し他ところ、それぞれに特徴があるが、予測性能全般としては同レベルであった。
(1) 生成アルゴリズム:条件付きWasserstein Generative Adversarial Network (WGAN) と"activation mximization (AM) / 活性最大化"(WGAN-AM)を採用した生成モデル [Extended Data Fig. 1 a 参照]。
(2)進化的アルゴリズム:ランダムな突然変異、フィットネス評価、選択を繰り返し、離散的なステップでフィットネスランドスケープを探索する [Extended Data Fig. 1 b 参照]。

 これらの予測モデル、探索アルゴリズム、フィットネス関数を含むモデル指向探索プロセスは、ユーザーが提供した標的配列を条件としているため、特定のゲノム部位に限定されることなく、どのような入力標的にも広く適用できる。

 検証実験は、エンテロウイルスB、ラッサウイルス、デングウイルス、ジカウイルスといった多様性、あるいはインフルエンザA、SARS-CoV-2といった公衆衛生に関連するRNAウイルスを対象に、行われた。

 研究チームは、Cas13ガイドRNA設計のために、これらの設計アプローチに簡単にアクセスできるソフトウェアパッケージを構築し、”Building Artificial Diagnostic Guides by Exploring Regions of Sequences (BADGERS)”と命名し、https://github.com/broadinstitute/badgers-cas13から公開した。

[注]
 BADGERSマルチターゲット検出を目的とした設計において、ガイドRNAを提案した。PFS (protospacer flanking site) に塩基"G"を持つゲノムサイトでは、アルゴリズムはしばしば、プロトスペーサーの28位(スペーサーの1位と同じ)のタグ (TAG) 配列に直接隣接するミスマッチを導入した。研究チームはこれをタグ隣接ミスマッチ(tag-adjacent mismatch: TAM)と命名した。興味深いことに、PFSに"G"を持つゲノム部位のうち、TAMはWGAN-AMアルゴリズムで設計されたガイドの45.7%、進化アルゴリズムで設計されたガイドの76.2%に存在し、また、TAMを持たないガイドRNAよりも高い活性を示した。一方で、PFSに"G"を帯びていないゲノム部位に対しては、そうした効果を示さなかった。
 研究チームは、TAMについてその分子機構を提案し、変異が導入されたガイドRNAが提案されたことは、BADGERSの大きな特徴を示しているとした。


[人工ガイドRNA関連crisp_bio記事]
このエントリーをはてなブックマークに追加

コメント

コメントフォーム
評価する
  • 1
  • 2
  • 3
  • 4
  • 5
  • リセット
  • 1
  • 2
  • 3
  • 4
  • 5
  • リセット