(創薬等PF・構造生命科学ニュースウオッチ 2016/08/19)
  • Corresponding author: Daniel G. MacArthur (Massachusetts General Hospital/Broad Inst.)
  • Nature 誌2016年8月18日号に、2014年10月20日に一般公開されたエクソーム変異データベースを総合的に解析した報告が掲載された。
  • このデータベースは、Exome Aggregation Consortium (ExAC)プロジェクトとして、14種類のコンソーシウム/コホート由来の配列データから、Genome Analysis Toolkit (GATK) HaplotypeCallerのデータ解析パイプラインで一括してSNVs(1塩基バリアント)とindelsをコールし直し、さらに品質管理を経て集積したエクソーム変異データベースである。
    • 10,195,872件の候補変異から7,404,909件の高品質変異データを抽出、これはエクソーム上で8塩基に1カ所の変異頻度に相当。91,000件のエクソームデータから60,806人のデータが選択された。この規模は1000Genomes(以下、1KG)とExome Sequencing Project (ESP)の規模をはるかに凌ぐ(参考図1a参照)。
    • 40120001
    • 出身は欧州、アフリカ、南アジア、東アジア、およびラテン系アメリカ(参考図1b参照)に分かれるが、東アジアが他の集団から遠いのは、中東と中央アジアが極めて少ないことを反映している。
    • 変異の多くが稀な変異である(参考図1c参照):頻度1%未満が99%;シングルトン(DB中に1件しか存在しない変異)が54%;新奇変異(1KGとESPには存在しないという意味で)が72%
    • CpG→TpGの比率が高い(参考図1d参照)
    • 123,629件の信頼性の高いindelsの95%は、長さが6塩基未満(参考図1e参照)
    • フレームシフト変異はインフレーム変異に比べてより少数であり、シングルトンの比率がより高く、その遺伝子産物の有害性の指標となる(参考図1f参照)
  • ミスセンス変異に対する遺伝子の不寛容性などの詳細な解析を実施
    • ExACの規模で初めてprotein-truncating variants(PTV)に対する遺伝子の不寛容性を評価可能になった。機能喪失型変異に不寛容な3,230遺伝子(言い換えると、必須遺伝子)を同定したが、その72%に対応する疾患表現型がOMIMデータベースにもClinVarデータベースにも見られなかった。
    • 複数の個人に見られる同一の変異はそれぞれ独立に発生しうる(世代を経る間に同一の変異が繰り返し起こる)
    • メンデル型遺伝病の病因とされた変異が、疾患表現型を伴なわないヒトにも高頻度に見られる事例が多々ある。 
      [注] ゲノム解析の結果見出された致死性とされる遺伝子変異が、ExACを参照した医師から"健常人の多くに存在する変異"であることを知らされて安堵したというジャーナリストCarl Zimmerのエピソードが"STAT"に掲載されている
    • PTVsによる遺伝子破壊が集団の間で多様なことを見出した。できる限り多様な多くの集団からのデータを集積することで、'ヒューマン・ノックアウト'の発見 、ひいてはその遺伝子の機能を解析することが可能になる。
  • ExACは一般公開後、国際的に500万回以上利用されており、大規模に集積したすべての配列データを共通のデータ解析プロトコル・パイプラインで処理することの価値を証明している。ExAcは120,000エクソームと20,000WGSを来年中に集積することを目指している。なお、本論文の共著者所属機関の所在国は、米国を圧倒的多数として、メキシコ、カナダ、スエーデン、フィンランド、英国、イタリー、スペイン、パキスタン、韓国ならびにオーストラリアである。
  • 関連Webサイト
  • MacArthurのブログとExAcデータベースを利用した文献
    • [自叙伝] MacArthurがロジスティクス・コンサルタントの職を辞して、生物学・バイオインフォマティクスを学び、本論文に至るまでの経緯
    • [論文] E. V. Minikel et al. “Quantifying prion disease penetrance using large population control cohorts” Sci. Transl .Med. 2016 Jan 20;8(322):322ra9.
    • [論文] R. Walsh et al. “Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples” Genet. Med. Published online 2016 August 17.