• [出典] "A Next Generation Connectivity Map: L1000 Platform and the First 1,000,000 Profiles" Subramanian A, ~ Golub TR. Cell. 2017 Nov 30;171(6):1437–1452.e17. (bioRxiv. Posted May 10, 2017. )
  • Broad Instituteを中心とする研究チームは2006年に、遺伝子発現のシグナチャーの共通性を手がかりにして遺伝子、薬剤そして疾患の間の対応関係を詳らかにしていくことで、ヒトゲノムの機能的ルックアップテーブルを目指して564種類の遺伝子発現プロファイルを格納したConnectivity Map (CMap)を構築・公開した(Science, 2016)。このCMapの利用者数は18,000人以上におよび、肥満・糖尿病や筋萎縮症の治療薬開発や、炎症性腸疾患と癌の新たな療法の研究開発に活用されてきた。この第1世代CMapは、164種類の摂動因子(perturbagens、低分子)が3種類の癌細胞株に与える遺伝子発現変動をAffymetrix GeneChip microarrayで解析したデータをもとにしていた。
  • 第1世代CMapからの拡充が当初からの懸案事項であったが、市販の遺伝子発現マイクロアレーはいうまでもなく、RNA-seqでさえも摂動因子と細胞株を多様化しCMapをゲノムスケールへと拡充するには、あまりにコストが過重であった。そこで、今回、トランスクリプトームを978種類の’landmark transcripts’へと縮退させたプラットフォーム'L1000(この'L'はlandmarkに由来する)'を開発し、第1世代の〜1,000倍のプロファイルからなる第2世代CMapを構築・公開した。
  • L1000アッセイに必要な試薬のコストは2ドル程度である。
  • L1000は、Gene Expression Omnibus (GEO)から公開されている12,031のAffymetrix HGU133A発現プロファイルをもとに、生物学的意味による事前評価を加えることなく、多変量解析を介したデータ駆動型で抽出した。L1000はヒト・トランスクリプトーム全情報量の82%をカバーしており、特定の機能クラスやタンパク質のクラスへの偏りがなく、また、30種類の組織にわたり特定の細胞系譜への偏りがないことも確認した。
  • L1000プラットフォームを対象として、42,080種類の摂動因子 (19,811 低分子、5,075遺伝子を標的とする18,493 shRNAs/3,462 cDNAs, および 314 バイオロジック)から1,319,138プロファイルを獲得し、これをCMap-L1000v1と命名し、全データをGEO(GSE92742)およびCMap Webサイト(CMap linked user environment (CLUE) analysis environment)から公開した。
  • CMap-L1000v1のデータセットは、アノテーションが付されている低分子を9種類の細胞株で評価した Touchstone v1と、アノテーションが付されていない低分子を3〜77種類の細胞株で評価したDiscovery v1で構成されている。
  • CMap-L1000v1を対象遺伝子からみると、ユニークな遺伝子12,318種類を網羅している。そのうち978種類が'landmark genes (LM)'として遺伝子発現を測定した遺伝子であり、残る11,350遺伝子のうち9,196遺伝子がGTExプロジェクト由来のRNA-Seqプロファイルの裏付けが得られた信頼性の高いデータを伴っている。これら二群のべ10,174遺伝子をBest INFerred Genes (BING) と呼び、全遺伝子をAll Inferred Genes (AIG)と呼ぶこととし、CMapの利用者は解析の際に、LM、BINGあるいはAIGを選択可能である。
  • CMap Webサイトは解析機能を備えており、解析対象とする生物学的事象に対応する遺伝子発現データのセットを投入すると、CMap内の遺伝子発現プロファイルとの類似性を基盤とする解析を介して、shRNAのオフターゲット作用、低分子の作用機序、疾患遺伝子の機能アノテーションなどが、遺伝子群と低分子および疾患との相関関係をルックアップすることが可能になる。
  • CMapは今後、低分子群の拡張、疾患関連遺伝子変異群の拡張、細胞群のiPSCやゲノム編集細胞などへの拡張に加えて、ハイコンテントイメージ解析(Image analysis in high-content screening)やプロテオミクス・プロファイリングとの融合へと、さらに拡充していく。
  • Q&AなどCMap解説Webサイト:Connectopedia: The CLUE Knowledge Base