2021-08-28 Nature Communications誌掲載論文の書誌情報を追記し,テキストの一部を更新
"Predicting base editing outcomes with an attention-based deep learning algorithm trained on high-throughput target library screens" Marquart KF. Allam A, Janjuha S [..] Krauthammer M, Schwank G. Nat Commun. 2021-08-25. https://doi.org/10.1038/s41467-021-25375-z
2020-10-29 初稿
[出典] "Predicting base editing outcomes with an attention-based deep learning algorithm trained on high-throughput target library screens" Marquart KF, Allam A, Janjuha S [..] Krauthamme M, Schwank G. bioRxiv 2020-07-05.  

 U Zurichの研究グループは、CBEとABEの塩基変換効率が遺伝子座によって大きく変動することが、ABE/CBEの臨床展開への障害になっていることから、数千の配列にABEとCBEを施した結果を元に、attention-based deep learning algorithmによって、CBEとABEによる塩基変換結果を高精度で予測するBE-DICTを開発した。
  • スクリーンショット 2021-08-28 6.39.46HEK293T細胞において、理論的にはCBEまたはABEで塩基変換可能 [*]であるランダムに生成した配列18,94623,123本と疾患関連遺伝子座の4,1235,171本の配列の計 23,06928,294本の配列からなるターゲットライブラリーの塩基エデティングの結果をベースとして、トレーニングセットと評価セットを用意した [* 標的塩基の8~18bp下流にPAMサイトを有するTまたはA]。[Figure 1参照 https://www.nature.com/articles/s41467-021-25375-z/figures/1; キャプションを除き右図に引用]
  • 入力としたデータにかかわる要素ごとに良い予測結果をもたらす重み付けを判定可能とするアテンション技術を伴う深層学習によって、標的塩基に隣接する塩基と標的塩基のプロトスペーサ配列内での位置が重要な因子であり、また、各ポジションごとの重みの評価が可能なったことで、予測結果と相関するモチーフ (連続的と言うよりは、不連続なモチーフ)も見えてきた。
  • 塩基エディターとしては、それぞ異なるデアミナーゼを利用するCBE4maxとTarget-AID (PmCDA1)、および、ABEmax (ecTadA7.10)とABE8e (ecTadA進化版) [1]の4種類の塩基エディターを評価した。 AUC値は~0.86-0.96で、AUPR値は~0.72-0.85であった。 (データベースとしてWebサイトから公開予定)
  • David Liuらの塩基エディター結果予測プログラムBE-Hive [2]および延世医科大学のグループが開発したDeepBaseEditor [3]と比較し、CBEに比べてABEの方が高精度であるところなど、概ね整合することを見出した 
  • BE-DICTは,標的ヌクレオチドとその周辺のバイスタンダーヌクレオチドの編集それぞれにつて,正確に予測可能とした深層学習モデルである[それぞれFig. 2Fig. 5参照]
  • データベース公開サイト: 論文記載www.be-dict.org は2021-08-28時点ではアクセス不調; 代替 "be-dict-org"でネット検索するか,https://bedict.forone.red/#/per-base または https://bedict.forone.red/#/bystander を指定]
  • プログラム公開サイトhttps://github.com/uzh-dqbm-cmi/crispr
[CBE/ABE gRNA設計支援・予測関連crisp_bio記事]
  1. 2020-08-01 ABE8eがR-ループ内のアデニンを脱アミノ化する過程のスナップショット
  2. 2020-06-13 Liuグループ, 塩基エディターの編集結果を予測する機械学習モデルBE-Hiveを開発・公開
  3. 2020-05-24 12,000サイトでのCBEとABEの編集結果をもとに機械学習を経て活性なgRNAsを設計・公開
  4. 2021-07-12 DeepCf1とDeepCas9に続くDeepABEとDeepCBE
[アテンション深層学習関連crisp_bio記事]
CRISPRメモ_2019-11-02の第5項から引用:
"Prediction of off-target specificity and cell-specific fitness of CRISPR-Cas System using attention boosted deep learning and network-based gene feature" Liu Q, He D, Xie L. PLoS Comput Biol. 2019-10-28
 ニューヨーク州立大学の研究チームが深層学習の手法 (attention boosted deep learning)に、遺伝子の細胞型に特異的な機能の知識ベースを融合することで、Cas9とCas12aを対象とするオフターゲット編集予測AttnToMismatch_CNNモデル と細胞型ごとのオンターゲット編集活性予測モデルAttnToCrispr_CNNモデルを開発し、DeepCrisprやDeepCpf1など既存のモデルに優ることを示した。