[出典] "Huge trove of British biodata is unlocking secrets of depression, sexual orientation, and more" Kaiser J, Gibbons A. Science 2019-01-03 1:20 PM.

英国バイオバンク概要
  • 英国バイオバンク (UK Biobank, UKB)は、2006年から2010年の間に英国国民保健サービス (UK HMS)を介してボランティアとして参加した40-69歳の英国国籍500,000人の協力と、Wellcome Trust、英国政府、および患者団体からの~3億ポンドの資金の上で、進められて来た。協力者の血液と尿を採取・解析し、生活習慣を調査し、社会生活、認知状態、ライフスタイル、および、身体的健康のデータを含む2,400種類の形質 (食生活、喫煙習慣、コンピュー使用時間などなど)データを集積し、血液データは、英国の他のデータベースからの癌診断、死亡および入院の記録と統合された。
  • UKBは今後、来春には臨床と処方を含むプライマリーケア・データも公開し、続いて、2019年3月に50,000人のエクソームデータ公開、2020年に500,000人すべてのエクソームデータ公開を予定している。さらに、100,000人を目標とする脳、心臓および腹部のMRIスキャンを始めておりすでに25,000人について完了し、MRI画像のアノテーションが進行中である(以下に、UK biobank imaging centreでの経験ツイートを引用)。UKBでの解析と協調して、Sanger研究所において50,000人の全ゲノムシーケンシングも進行中である。
オープンアクセスのインパクト
  • UKBは、2017年に8TB (テラバイト)のデータを公開した。高速インターネットとスパコンセンターを利用可能な研究者と低速インターネットと小規模なコンピュータシステムしか利用できな研究者にできる限り公平なアクセスを可能とするため、データ公開にあたり、暗号化したファイルをダウンロード可能な期間3週間*を設け、その後2017年7月19日に解読コードを提供する工夫をした (* 企業に対しては、9-12ヶ月と見られる)。
  • UKBが初めてボランティアを受け入れ始めた13年前、UKBは時間と資金の無駄とする批判があったが、UKBはいまや大方の研究コミュニティーに、被験者数の規模と臨床情報の品質の観点、そしてなによりもオープンアクセスのポリシーより、より大規模なバイオバンクに勝るとも劣らない研究基盤と認められている。
  • オープンアクセス:UKBの承認のもと(**)英国内外の誰でもが匿名化されたUKBデータをダウンロードし利用することができ、現時点で、〜7,000人の研究者が1,400プロジェクトにUKBデータを利用している (** 使用料 2,500ポンド;成果出版後、データ、結果、およびコードをUKBへ戻すこと、および、参加者特定を試みないとする法的拘束文書にサインすることが条件であり、共同研究契約は不要)
  • 2017年7月のデータ公開後2~3日のうちに米国グループが、これまで知られていた遺伝マーカ~6,000種類を含む120,000種類を超える遺伝マーカと2,000種類を超える疾患・形質をの相関を同定しブログに投稿した。
  • 2週間のうちに、生物学分野のプレプリント・オンライン・リポジトリであるbioRxivに、UKBデータを利用した研究論文ドラフトが投稿され始め、これまでに、心疾患、糖尿病、アルツハイマー病などの疾患のリスク遺伝子、および、性格形成、うつ病、出生時体重、不眠症などの形質に影響を及ぼす遺伝子の同定に関する論文が多数発表された。また、長年にわたり論争を招いてきた学習レベルや性的指向に相関するDNAマーカも報告された。
  • UKBから公開されたデータは、ヒトの進化に関する研究などUKBが当初想定していなかった研究にも貢献し始めており ("Genetic data on half a million Brits reveal ongoing evolution and Neanderthal legacy" Gibbons A. Science 2019-01-03 1:20 PM)、ほぼ日々、UKBのデータを利用した論文が刊行される状況になっている (crisp_bio注:下図のグラフは、NCBI PubMedを単純に”UK Biobank"で検索した結果)。UK Bnak
  • 論文には、コーヒーと死亡率の関連付けや、TVのbinge-watching (見続ける)と大腸癌の関連付けといった単純な相関解析も含まれるが、多くは、疾患リスク遺伝子の特定など目指したいわゆるGWAS論文であり、UKBのサンプルサイズの大きさが、多くの遺伝マーカが関与する多因性疾患に関する多遺伝子 (polygenic)リスク・スコアの算定に貢献することを期待できる。また、UKBと23andMeのデータを組み合わせて、教育レベルの個人差の11%を1,300種類の遺伝マーカに帰着することができるといった研究もすでにされている (Nature Genertics, 2018-07-23)。選別/差別につながりかねないこの研究に対して批判が起きたが、研究チームは、選別/差別は研究成果の悪用であり、また、"11%"は個々人のレベルに影響を与えるレベルではないとしている (注:UKBデータに基づくと、家庭収入と母親の教育レベルが子の教育レベルに与える影響の大きさがそれぞれ7%と15%とされている)
UKBの弱点
  • 参加者の94%が白人であり、祖先が欧州ではない米国人、アフリカ系またはアジア系にはUKBデータから得られた知見を直ちには適用できなことである。また、参加者が比較的高収入で研究を支援する意欲がありかつ時間に余裕がある層に偏っているという批判もされている。
  • UKB自身が参加者の多様性を広げることが期待されるが、他のbiobankプロジェクトとの協力による多様化の方が実現可能性が高いと思われる。例えば、Wellcome Trustが資金提供している中国Kadoorie Biobankは10民族由来の515,000人を対象とし、米国NIHは、データ公開を前提とする、マイノリティーグループが少なくとも50%を占める100万人規模のAll of US biobankプロジェクト、を計画しており、これらのバイオバンクとオープンアクセスを含めて協調していくことが望まれる。