1. ディープラーニングに基づくモデルにより、NHEJ/MMEJを介した1-bp挿入と病因変異修復を実現
[出典] "Predictable and precise template-free CRISPR editing of pathogenic variants" Shen MW (MIT), Arbab M (Broad) [..] Liu DR (Broad), Gifford DK (Broad),  Sherwood RI (BWH). Nature. 2018-11-07; Correction on 2019-02-04.

要約
  • 研究グループは今回、ハイスループットなCRISPR-Cas9実験結果に基づいて機械学習モデル、inDelphi、を教育し、Cas9が誘導するDNA二本鎖切断 (DSB)の修復結果を、テンプレートを伴わない修復過程についても予測可能であることを示し、それによるヒト疾患関連遺伝子変異の精密な修復を実現した。
背景
  • CRISPR-Cas9ゲノム編集技術は、gRNAの設計法、オフターゲット作用の機構の理解、Cas9とgRNAの改変・最適化などにより、その高精度化とPAM拡張を介した広域化が急速に進んできた。さらに、精密で効率的な一塩基置換を実現するbase editor (BE)が開発され、また、DSBをテンプレートを利用することで相同組み換え修復 (HDR)過程を介したDNAの挿入や置換の技術も進歩した。
  • しかし、BEやHDRにも課題がある。BEでは挿入や欠失を実現できない。HDRは、非分裂細胞では特に、編集効率が低く、望ましくない編集が誘導されるリスクを伴う。一方で、ヒト疾患の多くがindels変異に起因することから、そうした病因変異の修復に向けて研究グループは、予測可能でかつ効率的なゲノム編集技術の開発に取り組んだ。
NHEJ (非相同末端結合)とMMEJ (DNA末端マイクロホモロジー依存末端結合)の活用
  • ヒト細胞において、Cas9によるDSBは主としてNHEJとMMEJで修復されるが、その結果は、予測が難しい数百種類の遺伝型をもたらす。Cas9 DSBの末端結合修復過程によっても、DNAテンプレートのノックイン (HITI法PITCh法)が実現され、また、2カ所のDSBの間の配列欠失が実現されてきたが、一般には、NHEJとMMEJは精密なindel生成には使えないとされてきた。
  • その中で、末端結合修復の結果は局所的配列のコンテクストに依存して再現性があるとする報告がなされたが (*)、テンプレートを使用しない(テンプレート・フリー)末端結合によるDSB修復で得られる遺伝型の汎用的予測法は存在しなかった;(*)関連crisp_bio記事:CRISPR関連文献メモ_2016/08/12- 3. CRISPR/Cas9を介した二本鎖切断の修復パターンは標的サイトに特異的である
機械学習モデルinDelphiの教育
  • Streptococcus pyogenes Cas9 (SpCas9) によるゲノム編集結果をハイスループットでアッセイする手法を開発し、ヒトゲノムの配列の特徴に留意して選択した1,872サイトを標的とするゲノム編集に由来する末端結合修復結果のデータをもとに、テンプレート・フリーのCas9に誘導されるindels変異を一塩基分解能で予測可能とするinDelphi (WebサイトGitHubサイト)を構築した。
  • Cas9ゲノム編集の産物である遺伝子型は、マイクロホモロジーに依存する欠損、マイクロホモロジーに依存しない欠損、および1-bpの挿入に大別された。
inDelphiの予測
  • 5種類のヒト細胞株とマウス細胞株において、1-から60-bpの欠損および1-bpの挿入の遺伝型と頻度を、高精度 (r=0.87)で予測
  • テンプレート・フリーな末端結合修復を介したヒトゲノム編集において、これまでの見方と異なり、単一の遺伝子型を誘導するsgRNAs (ひいては遺伝子座)を同定:ヒトゲノムを対象とするSpCas9 gRNAsの5-11%が、産物の50%以上に予測可能な単一の遺伝子型を誘導し、このsgRNAsを‘precise-50’と命名
テンプレート・フリーなゲノム編集実験検証
  • inDelphiを利用して、ヒト疾患関連遺伝子に1-bp挿入をもたらす14 gRNAsを設計し、2種類のヒト細胞株においてその予測を確認した。
  • inDelphiを利用して、効率的で精密なテンプレート・フリーの機能獲得遺伝型修復が可能なヒト病因変異アレルを明らかにし、183種類の病原性ヒト微小重複 (microduplication)アレルの野生型アレルへの修復を50%以上の効率で実現した。この過程で、末端結合修復のなかのNHEJ欠損が野生型への修復を亢進することも見出した。
  • ヒト細胞とマウス細胞において、5種類の低比重リポタンパク質受容体 (low-density lipoprotein receptor , LDLR) の微小重複 (microduplication)の野生型への修復を、患者由来初代線維芽細胞において、 Hermansky-Pudlak症候群 (HPS1)  またはメンケス (Menkes)病に関連する微小重複の野生型への修復を実現した。
2. ランダムフォレストに基づく機械学習モデルにより、HDRを介した高効率な一塩基編集を実現
[出典] "Unlocking HDR-mediated Nucleotide Editing by identifying high-efficiency target sites using machine learning" O'Brien AR,  Wilson LOW,  Burgio G,  Bauer DC. bioRxiv. 2018-11-07.
  • 遺伝子変異と疾患の因果関係を解明するには、一塩基編集技術が必要である。CRISPR-Casシステムによる一塩基編集として、dCas9またはCas9nとデミアミナーゼを組み合わせたbase editor (BE)による一塩基置換と、修復用DNAテンプレート (ssODN)とHDRを介した一塩基編集が実現されているが、両者とも課題を残している。BEは、dCas9の標的サイト周囲の狭いウインドウ幅の内における特定の塩基置換に限定され、HDRによる一塩基編集は細胞周期依存とNHEJとの競合により極めて効率が悪い。
  • CSIROとオーストラリア国立大学の研究チームは今回、ランダムフォスト に基づく機械学習モデルを、目的にあわせた新たなマウスHDR編集実験 (原論文 Table 1から引用した下図左参照)の結果に基づいて教育し、HDRの効率を左右する因子を探った。
HDR HDR Fig 4
  • HDR効率を中央値より上と下に二分しそれぞれの実験条件について機械学習させ、HDRの効率に影響を与えると思われる因子を評価した。その結果、3' ssODN配列の組成がHDRの効率に決定的な影響を及ぼし (原論文Figure 4から引用した上図右参照)、また、gRNAの組成も影響を与えることから、gRNAと3'ssODNの配列に基づく機械学習モデルに到達した。
  • 機械学習モデルに基づく標的でのHDR効率は、従来選択されていた標的でのHDR効率から83%向上した。
  • BEによる一塩基置換の最適条件、BEが適合しない場合にHDRを介した一遺伝子編集を実現するに最適なgRNAとssODNを提示するCUNE (Computational Universal Nucleotide Editor)を構築・公開した:下図左右はCUNEの使用例 (Webサイトから2018-11-08 20:00取得)
CUNE 1 CUNE 2