(創薬等PF・構造生命科学ニュースウオッチ 2016/10/06)
- Corresponding authors: Obi L. Griffith; Elaine R. Mardis (Washington University School of Medicine, St. Louis)
- TCGA (The Cancer Genome Atlas)とICGC (International Cancer Genome Consortium)を代表とする大規模な癌ゲノム解析の成果は、がん個別化医療の基盤を築いた。しかし、臨床アノテーションやコンピュータによるデータ解析には、体細胞変異と癌生物学との関連性の観点から精選された(curated)データセットが必須である。
- WashUの研究チームは今回、癌研究コミュニティーが、論文の裏付けのある生物学的に重要な癌変異データを集積し利用可能とするデータベースDoCM(Database of Curated Mutations)を、Creative Commons Attribution 4.0 International Licenseのもとで構築公開した。最新バージョン(Version 3)には、1,364種類の変異と122種類の疾患が含まれている。
- DoCMは、既存の関連データベース由来のデータに加えて直接のデータ・サブミッションも受け付けて、DoCMでのアノテーションとcurationを経て集積していく(参考図は、DoCM Webサイトで公開されているBRAF V600Eのアノテーション例)
- 2016/10/05時点のデータセット:Kin-Driver;WashU hematologic malignancy mutation list;Literature;Drug Gene Knowledge Database;CIViC Knowledgebase;Pan-cancer recurrent hotspots;My Cancer Genome;Oncomap Variants
- TCGAの4つのプロジェクトでは同定されていなかった癌変異をDoCMで同定可能なことを実証(原著 Figure 7)
- DoCM Webサイト:http://docm.info
DoCMデータサブミッションサイト:http://docm.info/variant_submission
コメント