(創薬等PF・構造生命科学ニュースウオッチ 2016/10/16)
- Corresponding author: J. Craig Venter (Human Longevity Inc./JCVI)
- Illumina HiSeq X Tenによって、160人のサンプルについて、平均30×の多重度(深度)(*)、3日間、1ゲノム当たり1,000〜2,000ドルで全シーケンシングすることが可能になった。Venterらはこの装置を利用して、予備実験として、CEPH Utah Reference CollectionのNA12878をベンチマークとして、全ゲノムシーケンシング(WGS)の精度を評価し、WGSの品質標準を設定した。その上で、10,540人の全ゲノムシーケンシングとアノテーションを実行した。
(*)[注]- 次世代シーケンシング(NGS)解説Webサイト参照
- 東北メディカル・メガバンク機構は、健常な日本人1,070人の全ゲノムリファレンスパネル(1KJPN)のシーケンシングを多重度平均32.4×で行い、1,200万の新規を含む2,120万の一塩基変異(SNVs)、200万の新規を含む340万箇所の挿入・欠失、および25,923コピー数多型を同定
- コホートの構成
- [人種(マーカから推定)] 欧州 8283人;アフリカ 1397人;南アジア 135人;東アジア 218人;ネイティブアメリカン 199 人;シベリア・中東・オセアニア 313人(欧州系の比率 〜78%)
- [健康状態] 健常(推定)3,940人;ありふれた疾患 5,656人;神経系と稀な疾患 664人;癌または免疫疾患の疑い 285人
- 各ヒト・ゲノムの84%の領域について高信頼性の配列を得た。この領域はエクソン配列の91.5%と既知の病因変異(ClinVar)95.2%を含んでいた。
- タンパク質コーディング領域とノンコーディング領域にわたり、新規8,200万を含む1億5000万のSNVsを同定。
- ありふれた変異(コホートほとんどに共通して存在する変異)は、8,500ゲノムまでの解析で網羅された。
- ほとんどの変異の頻度は1%未満であり、各ゲノムごとに新規な変異8,579種類が発見された。また、hg38レファランス・ゲノムに存在しない新規配列0.7 Mbも見出した。
- 遺伝変異が浸透しない領域群(variation-intolerant sites, VIS(例 イントロン-エクソンのスプライス・サイト))も同定し、VISと既知の病因変異の間に高い相関があることを見出した。
- [データ公開] HLI Open Search (βバージョン)にて利用可能
コメント