1. 深層ニューラルネットワークモデルSeqCrisprを開発し、sgRNAの活性はsgRNAの配列に加えて標的遺伝子の遺伝子間相互作用のコンテクストにも依存することを同定
[出典] "Identifying Context-specific Network Features for CRISPR-Cas9 Targeting Efficiency Using Accurate and Interpretable Deep Neural Network" Liu Q, He D, Xie L. bioRxiv. 2018-12-24.;SeqCrisp入手Webサイト:https://github.com/qiaoliuhub/seqCrispr
  • CRISPR-Cas遺伝子編集のデータが蓄積されてきたことから、2018年に入って機械学習によるgRNA活性の予測精度の向上が報告され始めたが(*1)、細胞株によってデータの蓄積量が異なること、深層学習モデルがブラックボックス(**2)であり、生物学的解釈が難しく、オンターゲットの編集効率を支配する要素の特定が困難なこと、および、機能や必須性が異なる遺伝子を標的とするgRNAの効率を比較する合理的な手法が存在しないこと、といった課題が残っている。
  • (*1) CRISPRメモ_2018/02/04:3. CRISPR-Cpf1 gRNA活性予測精度を、深層学習(deep learning)により向上;CRISPRメモ_2018/07/02-1:7. DeepCRISPR:深層学習によるCRISPR gRNAの最適設計
    (**2) 2017-05-02 
    ブラックボックスである人工知能を開けて見たい
  • The City University of New Yorkの研究チームは今回、これらの課題解決を目指して、以下の特徴をもつ新たな深層ニューラルネットワークモデルSeqCrisprを開発した:Word2vec に倣った3-merヌクレオチドの表現 (隠れ層);局所的な生物学的特徴 (DNA-sgRNA融解温度、DNaseピーク、CTCFピーク、RRBSピーク、H3K4me3)と遺伝子間相互作用の特徴)の取り込み;再帰型ニューラルネットワーク (RNN)と畳み込みニューラルネットワーク (CNN)の融合;学習結果のデータ量が少ない細胞株への展開可能性 (K562, A549, NB4; HL60, HCT116, HeLa);CRISPR-Cas9のオンターゲット編集効率を支配する生物学的特徴を決定するランキングシステム
  • SeqCrisprは先行研究のgRNA設計支援システムの性能を上回り、また、SeqCrisprにより、sgRNAの3'末端の3-ntに加えて、遺伝子間相互作用(近接する遺伝子と発現量のデータ)が、CRISPR-Cas9のオンターゲット編集効率に決定的な影響を与えることを同定
2. 哺乳類細胞においてERADが分解すべきタンパク質を認識する機構をゲノムワイドCRISPR解析で同定
[出典] "Genome-wide CRISPR Analysis Identifies Substrate-Specific Conjugation Modules in ER-Associated Degradation" Leto DE [..] Kopito RR. Mol Cell. 2018-12-20.

背景
  • ERAD (endoplasmic-reticulum-associated degradation, 小胞体関連分解)は、小胞体内で天然構造へと折りたたまれなかったミスフォールドタンパク質を基質として、小胞体から細胞質への分泌経路の早期に、選択的に分解するタンパク質品質管理システムである。
  • ERADの基質は3種類のクラス、“-L” (lumen)、“-M” (membrane)“または-C” (cytosol)、に分類され、酵母では3種類のERAD全てを2種類の膜内在ユビキチンE3リガーゼ (Hrd1とDoa10)が担っていることが示されている。一方で、哺乳類細胞のERADにはHrd1とDoa10のオーソログ (HRD1とDoa10)を含む多数のE3と補助因子が関わっており、これまでの生化学的解析からはその分子機構の全貌はまだ明らかになっていない。
成果
  • スタンフォード大学の研究チームは今回、プール型ゲノムワイドCRISPR-Cas9スクリーニングにタンパク質のターンオーバーを定量的かつ高感度でアッセイする手法を組み合わせて、ヒト細胞株において、GFPで標識した多様なERADの基質 (以下、クライエント)についてそのターンオーバーを促進あるいは抑制する遺伝子同定を試みた。
  • 具体的には、ERADの2種類のクラス、ERAD-LとERAD-M、のクライエントとしてそれぞれ確定されているA1ATNHK-GFPとINSIG1-GFP、および、酵母では逆行輸送機構が明らかにされているリシンA毒素 (RTAE177Q)、細胞質におけるユビキチン・プロテアソームシステム (UPS)活性のレポーターとして利用されるGFPU*の4種類のクライエントについて、実験を進めた。
  • それぞれのクライエントについて、ERADに直接関与する遺伝子に加えてERADパスウエイ直近の上流と下流に位置する遺伝子を含む〜499-700遺伝子を同定し、クライエント間の共通性と特異性を比較解析し、凝集する傾向にあるタンパク質の効率的な分解が、ERADの各クラスに特異的な膜内在Ub E3モジュールと細胞質内のUb鎖結合機構の間の新奇な協働作用によることを見出し、ERADの3種類のクラスおよび4種類のクライエント認識・分解のモデルを提唱した(原論文 Figure 5参照)。