2023-05-06 Nature Niotechnology 論文を発展させたCell 論文紹介記事へのリンクを追記:2023-05-06 DeepPrime:ハイスループット解析と深層学習による広範なプライムエディター (PE) の効率と精度の予測
2020-09-29 初稿: Nature Niotechnology 論文紹介
[出典] "Predicting the efficiency of prime editing guide RNAs in human cells" Hui Kwon Kim, Goosang Yu [..] Hyongbum Henry Kim. Nat Biotechnol. 2020-09-21
 ・サービス提供Webサイト http://deepcrispr.info/DeepPE
 ・コード公開サイト https://github.com/hkimlab-PE/PE_SupplementaryCodePE components

 PE (Prime Editing)は、通常のCRISPR-Cas9ゲノム編集ツールよりも複雑な構造をしている。Cas9 (H840A)ニッカーゼに逆転写酵素 (RT)が付加され、ガイドRNAに、RTに転写されて標的領域に置き換わる塩基配列 (以下, RTテンプレート)とプライマー結合サイト (primer binding site: 以下, PBS)が付加されている [Wikipedia挿入図引用右図参照]。PE mechanism

 ゲノム編集進行時には、Cas9ニッカーゼでニックされたDNA鎖の3'末端に、
PBSを介してpegRNAが融合し、RTテンプレートが転写され、RTテンプレートによる標的配列の置換へと進行する。[Wikipedia挿入図引用左図参照]


 Yonsei University College of Medicineを主とする韓国研究グループは今回、この複雑なPEのハイスループットな効率評価実験を実現し、pegRNA設計支援サービスを公開するに至った。
  • David R. Liuらは2019年にPE1, PE2, PE3およびPE3bを発表した [*]。この中でPE1の効率が最低であり、また、PE3とPE3bは、PE2のpegRNAにさらにsgRNAを加えた形になることから、PE2を対象として実験を進めた。
  • HEK293T細胞において、pegRNAsとその標的配列54,836組*をベースとするPE2のG-to-C編集効率を測定した。
    [*] 2,000種類の標的配列について、PBSの長さ6種類とRTテンプレートの長さ4種類の組合せ = 48,000組; 2,000標的配列のうち200種類について、34種類のRTテンプレート=6,800組; 最初のPEから36組)
  • Tree SHAP (SHapley Additive exPlanations merged into XGBoost algorithm) [2]により1,766種類の因子を評価し、PE2の編集効率に影響を及ぼす因子として、DeepSpCas9スコア [3], PBSのGC含量, PBSの融解温度, 標的DNA領域の融解温度, RT-PBS領域内のUUの数から始まるトップヒット40を選定した。
  • 48,000組のデータに基づいて深層学習により編集効率を予測する計算モデルDeepPEを開発し、HCT116細胞とMDA-MB-231細胞での検証実験も行い、DeepPEが、与えられた配列に対してBSの長さとRTテンプレートの長さの組合せが最適なpegRNAを推定可能なことを示した。
  • 編集位置, 編集の型 (挿入, 欠失または1塩基変換)およびPAM編集への依存性を見るためであった6,800組のデータに基づいて、ランダムフォレスト法**によりPE-typeとPE_positionの2種類の計算モデルも構築した。また、PE2利用にあたり一般的な推奨条件も提案した。
    [**]比較的少数例のため、深層学習は有効ではなかった。
[関連crisp_bio記事と論文 (#3-5は著者らの先行研究成果)]
  1. crisp_bio 2019-10-22 crisrp_bio 2019-11-12 David R. LiuがBase Editing (BE)とPE (Prime Editing)の比較を問われて答えた
  2. "From local explanations to global understanding with explainable AI for trees" Lundberg SM [..] Lee SI. Nat Mach Intell 2020-01-17
  3. CRISPRメモ_2019/05/17-1 [第1項] SpCas9活性の深層学習モデルDeepCas9
  4. CRISPRメモ_2018/02/04 [第3項] CRISPR-Cpf1 gRNA活性予測精度を、深層学習(deep learning)により向上
  5. High-throughput analysis of the activities of xCas9, SpCas9-NG and SpCas9 at matched and mismatched target sequences in human cells. Kim HK [..] Liu DR, Kim HH. Nat Biomed Eng 2020-01-14