[出典] "Enhancing CRISPR-Cas9 gRNA efficiency prediction by data integration and deep learning" Xiang X, Corsi GI, Anthon C, Qu K [..] Gorodkin J, Luo Y. Nat Commun. 2021-05-28. https://doi.org/10.1038/s41467-021-23576-0
BGI-QingdaoとU. Copenhagenなどの中国とデンマークの研究者にHMSのGeorge M. Churchが加わった研究グループからの論文:
- これまでの機械学習や深層学習によるgRNAの活性予測プログラムには,モデルの検証や学習に利用されたデータセットに問題があった.
- 研究グループは,レンチウイルスベクターをサロゲートとする実験によって10,592個のSpCas9 gRNAsのオンターゲット活性を測定し [Fig. 1引用左下の図参照],これを補完する公開データと統合した23,902個のgRNAsのデータをベースとした深層学習モデルCRSIPRonに至った [Fig. 2引用右下の図上段の a 参照]
- CRISPRonは,その開発に使用したトレーニングデータとは重ならない4種類のテストデータセットにおいて,既存の予測ツール (DeepHF, DeepSpCas9, Azimuth, およびDeepSpCas9variants: 右上図の下段 b 参照)よりも有意に高い予測性能を示した.
- CRISPRonの予測性能には,配列のデータそのものに加えて,先行研究 [*]で検討していたgRNAと標的DNAとの二重鎖の自由エネルギーを考慮に入れてこたことが貢献した [*: CRISPRメモ_2018/10/31 [第2項] 核酸二重鎖エネルギーからCRISPR-Cas9のオフターゲット編集を評価].
- さらに,CRISPRonスタンドアローン・ソフトウエアをベースとする対話型のgRNA設計支援Webサーバを構築・公開した.同WebサーバーからはCRISPRonと共に,CRISPR-Cas9の特異性とオフターゲット活性を予測するCRISPRoffも提供されている.
[プログラムとWebサービスの取得・利用先]
- スタンドアロンCRISPRon: https://github.com/RTH-tools/crispron/
- CRISPRonサーバー: https://rth.dk/resources/crispr/ [右図参照]
コメント