[出典] "Discovering functional sequences with RELICS, an analysis method for CRISPR regulatory screens"  Fiaux PC, Chen H, McVicker G. (bioRxiv 2019-06-30.) PLoS Comput Biol 2020-09-16
 CRISPR KO/CRISPRi/CRISPRaスクリーンは遺伝子発現を調節する配列を発見する強力なツールであるが、データ解析とスクリーン結果の検証に課題があった。UCSDとSalk Instituteの研究チームは今回、RELIC (Regulatory Element Location Identification in CRISPR Screens)とCRSsim (CRISPR Regulatory Screen simulator)を開発して、その課題解決を試みた。
  • 調節配列のCRISPRスクリーンではスクリーンの過程で、コーディング領域とノンコーディング領域の双方を標的とするsgRNAsを含む細胞群が、薬剤添加やFACSを経て、そしてまた時系列に応じて、1つまたは多数のプールへと選別・集積され、プールごとにsgRNAがシーケンシングされ、カウントされる。このカウントに基づいてsgRNAsにスコアが付され、互いに近いsgRNAsのスコアを集積することで、一定のゲノム領域のスコアの定義に至る。
  • RELICは、プール間でのsgRNAsのペアワイズ比較にはよらずに、一般化線形混合モデル (Generalized Linear Mixed Model: GLMM)に基づいて調節配列を同定していく。具体的には、関心ある遺伝子 (genes of interest: GOI)のエクソンまたはプロモータを標的とすることが確定しているsgRNAsから構築するポジティブコントロール・モデルと、ポジティブコントロール以外のsgRNAsまたは調節配列を標的としないことが明確なsgRNAsから構築するバックグラウンド・モデルとの比較から、各プールに見られるsgRNAsごとに「調節配列らしさ」を示すRELICスコアを算定し、続いて、このRELICスコアをゲノム上の各塩基へとマッピングする。その上で、単一のsgRNAによるCRISPR KOでは20 bpの領域、CRISPRiとCRISPRaでは1 kbの領域など、ゲノム上の領域について「調節配列らしさ」をスコアしていく。
  • CRSsimは、sgRNAを送達した細胞群を入力とするCRISPRスクリーン実験を模して、sgRNAsの分布を入力として、ディリクレ分布と多変量超幾何分布に基づくサンプリングの結果からsgRNAsのカウントとスコアを計算する。このCRSsimの結果は、既報の実験結果と整合する。
  • 研究チームはCRSsimによって144種類のシナリオごとに'基準'データセットを生成し、RELICSと既存の解析手法 (edgeR, DESeq2, CRISPRsurf)を評価し、ほとんどのシナリオで、RELICSがもっとも優れているとした。
  • 続いて、15種類の遺伝子を対象とする8種類の公開データセットをRELICSで解析し、既報の調節配列に加えて、新奇調節配列を同定した。
プログラム提供GitHubサイト
関連crisp_bio記事