[出典] “Genomic Determinants of Protein Abundance
Variation in Colorectal Cancer Cells.” Roumeliotis TI et al. Cell Rep 2017 Aug 29;20(9):2201–2214.
bioRxiv.
Posted December 9, 2016.
概要
- ゲノム変異がタンパク質ネットワークに、ひいては細胞生理活性に、どのようにどのような影響を与えるかを理解することから、癌の不均一性の由って来る所以を理解することが可能になる。サンガー研究所とEBIを中心とする英、オランダ、独の共同研究チームは今回、ゲノム変異と癌の不均一性とをタンパク質発現量を介して紐づけることを目指して、50種類の大腸癌細胞株のパネル(COREAD)を対象とするゲノミクス、トラスクリプトミクスおよびプロテオミクスの統合的解析を行った。
- COREADについてはこれまでに、全エクソームシーケンシングと、遺伝子発現、コピー数およびメチル化のプロファイリングが行われていたところ、今回、アイソバリック標識法(isobaric labeling)とトライブリッド質量分析によって、大腸癌細胞株あたり平均9,410種類のタンパク質と11,647種類のリン酸化ペプチドを、細胞株間で相対的に定量した。
- ゲノム、トランスクリプトームに加えてプロテオームとリン酸化プロテオームのデータセットにさらに公的データベース群を融合することで、下図左のGraphical AbstractとFigure 1にあるように、発現量から見たタンパク質の共変異ネットワーク(Protein co-variation network, Figure 1に拡大図)を構築し、遺伝子変異がタンパク質の発現量に直接与える影響(direct effects)と変異タンパク質から相互作用するタンパク質へと広がる間接的影響(collateral effects by protein co-regulation)を分析し、さらに、癌細胞のプロテオームの特徴から抗癌剤応答を予測するPharmacoproteomic Models(下図 Figure 7)を構築した。
タンパク質間相互作用
- プロテオームのデータ解析では、COREADパネル内で発現量が共変化するタンパク質(co-variation)に注目した。COREADパネルの80%以上の細胞株に存在した8,295タンパク質のペアワイズ相関に基づくタンパク質間相互作用のネットワーク解析をweighted correlation network analysis (WGCNA)によって行った。
- WGCNAネットワークは、既知のタンパク質複合体やタンパク質間相互作用(CORUM登録の7,248種類とSTRING登録の20,969種類)を含む87,420組のタンパク質間相互作用で構成されたが、ネットワーク上で、284種類のタンパク質モジュール(メンバータンパク質数3〜1,012)を識別するに至り、それぞれにGOを始めとする公共データベースを参照し機能アノテーションを加えた。
- 挿入図Figure 1は、大腸癌タンパク質ネットワークにおいて、メンバーのタンパク質数が50個以上のモジュールと主要なアノテーションである[参照DB:GO、CORUM、KEGG、GOBP-slim、GSEAおよびPfam。
- このWGCNAネットワークにタンパク質発現量をマップすることで、各細胞株の生物学的特徴を判別可能にするco-variomeを構築した。リン酸化プロテオームのデータ解析からは、共リン酸化タンパク質の分析により、キナーゼと基質の相関をde novoで予測可能にする手がかりを得た。
ゲノム変異とタンパク質発現量の相関
- 遺伝子変異とDNAコピー数異常がタンパク質発現量に直接影響を及ぼすのはプロテオームの一部であることが示唆された。例えば、ミスセンス変異は、TP53を例外として、タンパク質発現量にはほとんど影響を与えない。また、ナンセンス変異は、mRNAの分解に加えて、翻訳そしてまたは翻訳後修飾の過程で、タンパク質発現のさらなる下方制御につながって行くことが示唆された。
- 特定の遺伝子の変異の影響が、タンパク質間相互作用を介して、他の遺伝子の産物タンパク質へと及んで行くという仮説をたて、強く共変化するタンパク質ペアからなるmutation-vulnerable networkを構築した。このサブネットワークは特定のタンパク質発現の遺伝子変異による下方制御によって、それと相互作用するタンパク質発現が下方制御される関係を表現しており、306タンパク質と278の相互作用で構成され、少なくとも10種類のよく知られたタンパク質複合体を含んでいる。
- 例えば、BAF複合体およびPBAF複合体と、クロマチン再編成タンパク質(ARID1A, ARID2およびPBRM1)との関係であり、CRISPR-Cas9によるノックアウト実験で、この関係を検証した。また、タンパク質発現の調節が、mRNAレベルの調節とは独立な現象も改めて確認した。
プロテオミクスに基づいたCOREADの分類
- 細胞株間で変異が大きい上位30%のタンパク質2,161種類の発現量プロファイルに基づいたCOREAD大腸菌細胞株のクラスタリングを試み、これまでの大腸癌分類体系を整合しつつより精密なサブタイプの定義が可能なことを示した。
薬剤応答推定モデルの構築
- ゲノム変異、メチル化、遺伝子発現、プロテオームおよびリン酸化プロテオームの特徴を入力とするElastic Net Modelに基づく、50種類の大腸癌細胞株の抗癌剤265種類(市販薬48種類、治験薬76種類, 実験的低分子141種類)に対する薬剤応答モデルを構築・評価した。その結果、挿入図Figure 7-Bにあるように抗癌剤ごとに特異的なデータモデルによって薬剤応答が推定されることを見出した。プロテオミクスに基づくデータモデルでは、薬剤排出トランスポーターABCB1とABCB11の発現量が特徴量となっていた。
COREADプロテオミクス・リン酸化プロテオミクスデータ・FTPサイト:
- ftp://ngs.sanger.ac.uk/production/proteogenomics/WTSI_proteomics_COREAD/
- Integrative Genomics Viewer、Morpheus clustering web tool、EnsmblおよびUCSC Genome Browserと互換のファイルを入手可能
関連論文
- 乳癌のプロテオゲノミクス“Proteogenomics connects somatic mutations to signalling in breast cancer.” Mertins P et al. NCI CPTAC. Nature. 2016 Jun 2;534(7605):55-62. Published online 25 May 2016.
コメント