[出典] Long-read Individual-molecule Sequencing Reveals CRISPR-induced Genetic Heterogeneity in Human ESCs. Bi C, Wang L [..] Huang Y, Li M. bioRxiv 2020-02-11

 King Abdullah University of Science and Technologyと北京大学が、細胞集団から極めて稀な変異の定量的検出を実現する手法 (IDMseqVAULT)を開発し、それによって、CRISPR-Cas9 RNPのエレクトロポレーションが、indelsに加えてヒト多能性幹細胞 (hESCs)に大規模な欠失と挿入を誘導することを再確認した。

IDMseqとVAULT
  • IDMseqはIndividual DNA Molecule sequencingに由来し、解析対象となるDNA分子に短いDNA配列をUMI (unique molecular identifier)/分子バーコード (molecular barcodes, MBC) を結合した後に増幅し、ショートリードまたはロングリードのシーケンシング (Illumina, PacBioおよびNanopore)を介して、同じUMIを帯びたDNA分子からの配列群のコンセンサスの度合い(一様性)から実験に由来するエラーを排除して変異を精度良く検出する。これまでのコンセンサスシーケンシングの改訂版に相当する。
  • VAULTは Variant Analysis with UMI for Long-read Technologyに由来し、IDMseqからのシーケンシングデータをを解析するために新たに開発したデータ解析プログラムである。
CRISPR-Cas9 RNPによるhESCs遺伝子編集の評価
 人工的に構成した不均一な細胞集団でのシミュレーションにより、稀な変異を帯びた細胞亜集団の検出感度が10-4に達することを確認し、また、ヒト多能性幹細胞 hIPSCsゲノムの構造変異などを同定した後、Cas9遺伝子編集がもたらす変異の解析に進んだ。
パネキシン 1遺伝子 (PANX1イタ)の第1/第3エクソン (Pan1/Pan2)を標的とするCas9-gRNA RNPの結果を、ナノポアシーケンシングによるIDMseqとVAULTで解析し、Pan1の7,077 bpとPan3の6,595 bpを解析: 280万リード/310万リードを3,566/8,870 UMIグループに集約した。
  • 構造変異 (SVs)については、Pan1においてもPan3においても、大規模欠失または挿入が発生するホットスポットが存在することを示唆する結果が得られた:[Pan1] 3,566 UMIグループのうち200 UMIグループに200種類の構造変異 (31-5,506 bpの規模; 欠失 195と挿入 5を含む)が存在;56 UMIグループに同一の5,494-bp欠損; 18 UMIグループに同一の4,715-bp欠損、3 UMIグループに共通; [Pan3] 8,870 UMIグループの232 UMIグループに240種類の構造変異 (31-4,238 bpの規模; 欠失 178, 挿入 50, 逆位 12); 27 UMIグループに同一の 4,238-bp欠失, 6 UMIグループに同一の 2,750-bp挿入)
  • 一塩基変異 (SNVs)については、Pan1では2,731 UMIグループに10,871 SNPsが、Pan3では8,018 UMIグループに23,477 SNVsが見れ、いずれも高頻度なSNPsと低頻度なSNPsに分類でき、前者はSNPデータベースに登録されてるSNPsに一致し、後者は遺伝子座全域に分布しデータベース登録SNPsには一致せず、体細胞変異が示唆された。SNPsのCas9切断サイトへの偏りは見られなかった。
  • SVsとSNVs以外に、Cas9切断サイトの周囲に小規模なindelsを同定した。
  • IDMseqから導出した変異データは、サブセットでの検証であるが、単一細胞サンガーシーケンシングからの変異データと一致した。
 IDMseqとVAULTは、血中循環DNAにもとづく癌の検出や治療中および治療後に残留している微量の白血病細胞の検出にも有用である。

[関連crisp_bio記事]
  • 2018-07-17 CRISPR-Cas9が誘導するDSBの修復は、ゲノムの大規模な削除と複雑な再編に至る
  • 2020-02-11 増幅不要なロングリードシーケンシングから、見えていなかったCas9のオフターゲット編集部位が見えてくる