[出典] "Accurate deep learning off-target prediction with novel sgRNA-DNA sequence encoding in CRISPR-Cas9 gene editing" Charlier J, Nadon R, Makarenkov V. Bioinformatics. 2021-02-18. https://doi.org/10.1093/bioinformatics/btab112
 Université du Québec à MontréalとMcGill Universityの研究チームの成果。
  • オフターゲット予測はスコアをベースとするアルゴリズムに続いて、深層学習モデルにもとづくアルゴリズムが広がってきた。研究グループは今回、sgRNAと標的DNAのデータを、(2 x 4) x L*マトリックスへとエンコードすることで、エンコーディングにおける情報損失を抑制することで、これまでの深層学習モデルよりも高性能なオフターゲット予測を実現した [* 2はsgRNAとDNAに、4はA/T/G/Cに、Lが配列ペアの長さに相当する]。
  • 深層学習モデルのフィードフォワードニューラルネットワーク (FNNs), 畳み込みニューラルネットワーク (CNN), ならびに再帰型ニューラルネットワーク (RNN),  および、従来の機械学習の手法であるランダムフォレスト (RF)それぞれに基づくシミュレーションを行った。
  • FNNs, CNNsおよびRNNsについてレイヤーの深さを変えながら、CRISPORとGUIDE-seq遺伝子編集データセットを対象に、オフターゲット予測を行った。
  • 全例において、新たなエンコード方式が、これまでになく精密なオフターゲット予測を実現し、AUC (area under the Receiver Operating Characteristic)が35%向上した。
 [参考crisp_bio記事・論文]
  1. 2017-04-16 CRISPR-Casヌクレアーゼのオフターゲット効果をゲノム全域にわたって俯瞰可能にするGUIDE-seq. https://crisp-bio.blog.jp/archives/1536817.html
  2. "CRISPOR: intuitive guide selection for CRISPR/Cas9 genome editing experiments and screens"  Concordet J-P, Haeussler M. Nucleic Acids Res. 2018-05-14. https://doi.org/10.1093/nar/gky354