[出典] "SubCellBarCode: Proteome-wide Mapping of Protein Localization and Relocalization" Orre LM, Vesterlund M, Pan Y, Arslan T [..] Lehtiö J (Karolinska Institutet). Mol Cell. 2019-01-03;WebサイトSUBCELL BARCODE - A web portal to proteome sub cellular localization (下図画面キャプチャ参照)SUBCELL BARCODE
  • 解析パイプライン:細胞コンパートメントを5種類の細胞分画*に分離したサンプル2セットについて、低発現タンパク質の検出も可能な高深度 (in-depth)な10セットの定量的質量分析 (HiRIEF-LC-MS)を経て得られる各タンパク質ごとの分画プロファイルに基づき、細胞内の局在を特定する (* 各細胞分画に濃縮が想定される細胞コンパートメントは例えば、サイトゾル・細胞骨格、核・ミトコンドリア・細胞膜、など)。
  • 測定:5種類のヒト細胞 (表皮癌由来A431; 乳腺癌由来MCF7; アストロサイトーマU-251; 細気管支肺胞上皮癌NCI-H322; 肺腺癌HCC-827)を対象とする50 (10セット x 5)回測定し、結果的に、5細胞全てに共通するタンパク質8,140種類を含む12,418種類のタンパク質(遺伝子)の分画プロファイルを得た (原論文 Figure 1- Cの表参照)
  • 局在化の判定:共通タンパク質8,140種類の中で、5種類の細胞株全てにおいて分画プロファイルが安定しているタンパク質3,365種類をマーカと位置付けることで仮説によらずデータ駆動型の局在化解析を試みた。はじめに、分画プロファイルをt-SNE (t-distributed stochastic neighbor embedding)により解析しmclustを介して、マーカタンパク質を15種類のクラスタに分類した。続いて、15クラスタに分類された遺伝子を対象とするGene Ontology (GO)とUniProtの細胞コンパートメントのアノテーションのエンリッチメント解析から、15クラスタをそれぞれ特定の細胞コンパートメントを割り付け、加えて、4種類の領域 (原論文では"neighborhoods")に大別しそれぞれ、 分泌系、核、サイトゾルならびにミトコンドリアと定義した(原論文Figure 1-E参照)。その上で、全タンパク質を15クラスターと4領域に帰属させた。
  • 各タンパク質のクラスターまたは領域への相対的帰属確率をそれぞれ積み上げ棒グラフに色分けして表示するとバーコードが見えることから、今回“SubCellBarCodes”と称するに至った (EGFRバーコードの例 原論文Figure 3 A 参照)。今回単一コンパートメントに局在と判定したタンパク質7,589種類については、GOUniProtとの領域レベルで、Cell Atlas (抗体を利用した解析結果)ならびにCOMPARTMENTSとの細胞コンパートメントレベルでの整合性を検証し、みられた差異について論じた。
  • また、各タンパク質の細胞特異的局在化、キナーゼやE3リガーゼなどのタンパク質クラスの細胞内分布、タンパク質を構成するドメインからみた局在化、タンパク質複合体の膜への共局在、および、選択的スプライシングがタンパク質局在化に与える影響についても論じた。
  • さらに、HCC-827細胞株においてEGFR阻害剤 (ゲフィニチブ)投与に応じたタンパク質の再局在化を明らかにした(原論文Figure 7参照)。すなわち、今回構築したパイプラインにより特定の条件下でのタンパク質細胞内局在の動態 (時空間調節機構)の解析が可能なことを示し、SubCellBarCodesの手法を、翻訳後修飾、体細胞変異、生殖細胞系列変異などがタンパク質局在に与える影響の分析にも展開可能とした。