CRISPR-Cas9は画期的な遺伝子編集技術であるが、sgRNAの活性を予測することが、依然として課題になる。ディープラーニングの登場によって、それ以前のスコアリングや機械学習手法に比べて、より高い予測精度と拡張性が実現されてきた。しかし、局所特徴抽出、配列間依存性モデリング、そして動的な特徴重み付けには依然として課題として残っている。中国の研究チームがこの課題解決を試みた:
- まず、従来の畳み込みアーキテクチャの限界に対処するため、並列マルチスケール畳み込み(multi-scale convolution: MSC)[Measurement, 2022] 構造を組み込むことで畳み込みモジュールを強化する。
- 次に、CRISPR-Cas9 sgRNA効率予測のためのマルチヘッドセルフアテンション(multi-head self-attention: MHSA)[arXiv, 2021] に基づく新しい深層学習フレームワークを提案する。
- 最後に、BiGRU (Bidirectional Gated Recurrent Unit) とMHSAを統合し、配列データにおける局所的な動的特徴とグローバルな長距離依存性の両方を捉える予測モデルを開発する。
- さらに、sgRNA配列の固有の特徴を抽出・学習するために、One-hotエンコーディングおよびLabel Encoding [arXiv, 2021] 戦略を実装する。One-hotエンコードされた配列とLabel Encoding から導出された表現を組み合わせることで、sgRNAオンターゲット予測のための最終的な予測モデルであるCRISPR_HNNを構築する。
- 最後に、ハイブリッドディープラーニングモデルを活用し、配列の位置的特徴に基づいて位置特異的なヌクレオチド重要度を可視化する。
公開データセットを用いた実験結果は、CRISPR_HNNの優れた競争力を示し、オンターゲット活性予測における既存の最先端手法を凌駕する性能を示した。
[出典] "Prediction of CRISPR-Cas9 on-target activity based on a hybrid neural network" Li C, Zou Q, Li J, Feng H. Comput Struct Biotechnol J. 2025-05-08. https://doi.org/10.1016/j.csbj.2025.05.001 [著者所属] Zhejiang A&F U (School of Mathematics and Computer science), U Electronic Science and Technology of China (Yangtze Delta Region Institute , Institute of Fundamental and Frontier Sciences);グラフィカルアブストラクト
コメント