[注] 記述子 (descriptors) :論文本文中では、主として、features/scoresが使われている。
[出典] "Comprehensive computational analysis of epigenetic descriptors affecting CRISPR-Cas9 off-target activity" Mak JK, Störtz F, Minary P. BMC Genomics 2022-12-06. https://doi.org/10.1186/s12864-022-09012-7 [著者所属] U Oxford.
 CRISPR-Cas9ゲノム編集の医療分野への普及の障害になっているオフターゲット活性には、クロマチンの一次構造やエピゲノムの様態が影響している可能性がある。Fig. 1オックスフォード大学の研究チームは今回、オフターゲットデータベースであるcrisprSQL [*]を利用し、19種類のエピジェネティック記述子とCRISPR-Cas9のオフターゲット活性との相関関係を解析した [Fig. 1引用右図参照]。
 19個のエピジェネティックな特徴・スコアと呼ぶ記述子は、実験から得られる6種類のエピジェネティックな特徴(CTCF、DNase I、DRIP、H3K4me3、MNase、および RRBS)とヌクレオソームの占有と位置どりに関して算出した13種類のスコアで構成されている。これらの中で2種類の実験的特徴(MNaseとDRIP)と13種類の算出スコアの15種類が今回新規にとりあげた記述子である。他の4つの既存スコアは、オフターゲット活性予測のための深層学習モデルで一般的に使用されている実験的特徴(CTCF、DNase I、H3K4me3、RRBS)である。
 データ・キュレーションのために、既存の実験的なヌクレオソーム占有データからMNaseを集約した。また、crisprSQLで利用可能な配列コンテキスト情報に基づき、オフターゲットサイトのヌクレオソーム占有/位置決めスコアを算出した。
 先の挿入図にあるように、19 のエピジェネティックな特徴とオフターゲット活性の関係を調べるために、スピアマンとピアソンの相関分析を行った。その結果、トレーニング・ベースのモデルやトレーニング・フリーのアルゴリズムから得られたいくつかの計算スコアは、すべての実験的エピジェネティック特徴よりも優れていることが明らかになった。Fig. 3.4
 次に、オフターゲット活性を予測する機械学習/深層学習モデルにおいて、すべてのエピジェネティック特徴の寄与を評価した。その結果、6つの実験的特徴とは異なり、いくつかの計算されたスコアが両モデルの予測に大きく寄与していることを同定した [Fig. 3/4引用右図参照]。

 [*]
[最近の関連crisp_bio記事]