[出典] "Massively parallel profiling and predictive modeling of the outcomes of CRISPR/Cas9-mediated double-strand break repair" Chen W [..] Shendure J. NAR 2019-06-05.

背景
  • 哺乳類細胞における二本鎖DNA切断の修復には、相同なテンプレート配列による相同組換えによる精密な修復 (Homology Directed Repair: HDR) と、切断末端を直接結合する典型的な非相同末端結合 (classical  non-homologous end joining: c-NHEJ)によるindelsを伴い誤りの多い修復に加えて、DSBサイトの近傍の短い相同な配列 (microhomology: MH)を介したalternative NHEJ pathway (alt-NHEJ)による修復が知られている (alt-NHEJは、microhomology mediated end joining (MMEJ)とも呼ばれる)。
  • また、誤りの多いNHEJ修復結果が、標的DNAの配列コンテクストや切断パターン (平滑末端か粘着末端か;粘着末端のオーバーハングの長さ)に依存することが報告されているが、NHEJ修復パターンを決定づける配列プロファイリングは少数例に基づいていた。
概要
  • University of WashingtonとUC Santa Cruzなどの研究グループは今回、c-NHEJとalt-NHEJの双方を含むNHEJによる修復がもたらす変異のパターンと頻度を対象とするこれまでに無い大規模解析を行い、そのデータに基づいて、局所的配列コンテクストからのNHEJ修復結果予測を可能とする機械学習モデルを構築した
実験方法 (Figure 1引用下図参照)Lindel 1
  • SpCas9を発現させたHEK293T細胞に、sgRNAと標的配列 (Target)のペアを帯びたレンチウイルスライブラリ (lentiGuide library with sgRNA/target pairs)を送達し、6,872種類の標的配列に対するCRISPR-Cas9によるDSBとそのNHEJ修復により誘導された変異~116万例のプロファイルを、PCR増幅を経たハイスループット・シーケンシングにより判定した。
NHEJ修復がもたらす変異プロファイル (Figure 2 引用下図左とFigure 4引用下図右参照)
Lindel 2 Lindel 4
  1. 挿入 (Insertions)変異は、DSBサイトの上流直近の配列をテンプレートとする1 bpが支配的であった (上図左 A)。
  2. 欠損 (Deletions)変異は、その76%がMHに由来していた (MMEJの定義と頻度についてそれぞれ上図右のAとBを参照)。研究グループは、MHに依存する欠損とMHに依存しない欠損のそれぞれに独特なパターンを見出し、その分子機構に考察を加えるとともに、人工的にMHを導入した標的配列を対象とする補足実験を行い、NHEJ修復の中でMMEJ修復が占める重みを論じた。
  3. 繰り返し実験の比較から、標的ごとの変異プロファイルの再現性は高いことを見出した (上図左 B)。
  4. 一方で、標的間で変異パターンが大きく変動し、変異プロファイルの中で特定の変異パターンが支配的な低エントロピー標的から多様な変異パターンが共存する高エントロピー標的に至る分布が見られた (上図左 C〜F)。
機械学習モデルによる変異パターン予測
  • 再現性が比較的低い標的や編集効率が低い標的のデータを除くなどの前処理をした上で、4,790種類の標的配列を、トレーニングセット3,900配列、バリデーションセット450配列、およびテストセット440配列に分割した上で、学習・検証したロジスティック回帰モデルにより、標的配列からの挿入/欠損比、欠損パターン536種類の分布、および、挿入パターン21種類の予測を実現し、このモデルを、logistic regression model to predict insertions and deletions (Lindel)と命名した。
  • スタンドアロンのLindel webツールをhttps://lindel.gs.washington.eduにて公開し、また、CRISPR/Cas9システムによるゲノム編集を支援するCRISPOR webツール http://www.crispor.orgにも組み込んだ。
  • 研究グループは、Lindelと第三者によって発表されたモデルと比較し、概ね整合するとしたが、その中で、LindelのトレーニングセットとFORECasT*のトレーニングセットを組み合わせた14,625配列をもとにLindelモデルを学習させることで、元のLindelとFORECasTよりも優れたモデルに到達した。
課題と応用
  • Lindelについて、PCRを介した解析であるため検出した欠損は小規模に限られて稀な大領域の欠損を見逃している可能性や、レンチウイルスによる実験であったため解析部位が開いたクロマチン構造領域に偏っている可能性を議論し、また、応用の観点から高エントロピーの標的と低エントロピーの標的の使い分けなども議論した。
NHEJ誘導変異プロファイル関連crsip_bio記事
  • CRISPRメモ_2018/12/14 [第1項] CRISPR-Cas9ゲノム編集の精度と編集結果予測可能性は標的配列に依存する
  • 2018-11-28 BE3とCas9がオフターゲットとオンターゲットに誘導する変異プロファイル2報 [第2項] Cas9遺伝子編集によるオンターゲット変異プロファイルのハイスループット測定と編集結果予測Webツール開発:(*) FORECasT https://partslab.sanger.ac.uk/FORECasT
  • 2018-11-08 機械学習モデルにより一塩基編集技術を磨く [第1項] ディープラーニングに基づくモデルにより、NHEJ/MMEJを介した1-bp挿入と病因変異修復を実現:inDelphi
  • CRISPR関連文献メモ_2016/08/12 [第3項] CRISPR/Cas9を介した二本鎖切断の修復パターンは標的サイトに特異的である