[出典] "Enhancing CRISPR-Cas9 gRNA efficiency prediction by data integration and deep learning" Xiang X, Corsi GI, Anthon C, Qu K [..] Gorodkin J, Luo Y. Nat Commun. 2021-05-28. https://doi.org/10.1038/s41467-021-23576-0
 BGI-QingdaoとU. Copenhagenなどの中国とデンマークの研究者にHMSのGeorge M. Churchが加わった研究グループからの論文: 
  • これまでの機械学習や深層学習によるgRNAの活性予測プログラムには,モデルの検証や学習に利用されたデータセットに問題があった.
  • 研究グループは,レンチウイルスベクターをサロゲートとする実験によって10,592個のSpCas9 gRNAsのオンターゲット活性を測定し [Fig. 1引用左下の図参照],これを補完する公開データと統合した23,902個のgRNAsのデータをベースとした深層学習モデルCRSIPRonに至った [Fig. 2引用右下の図上段の a 参照]
Fig. 1  Fig. 2
  • CRISPRonは,その開発に使用したトレーニングデータとは重ならない4種類のテストデータセットにおいて,既存の予測ツール (DeepHF, DeepSpCas9, Azimuth, およびDeepSpCas9variants: 右上図の下段 b 参照)よりも有意に高い予測性能を示した.
  • CRISPRonの予測性能には,配列のデータそのものに加えて,先行研究 [*]で検討していたgRNAと標的DNAとの二重鎖の自由エネルギーを考慮に入れてこたことが貢献した  [*: CRISPRメモ_2018/10/31 [第2項] 核酸二重鎖エネルギーからCRISPR-Cas9のオフターゲット編集を評価].
  • さらに,CRISPRonスタンドアローン・ソフトウエアをベースとする対話型のgRNA設計支援Webサーバを構築・公開した.同WebサーバーからはCRISPRonと共に,CRISPR-Cas9の特異性とオフターゲット活性を予測するCRISPRoffも提供されている.
 [プログラムとWebサービスの取得・利用先]Web site