出典
  1. [論文] International evaluation of an AI system for breast cancer screening. McKinney SM, Sieniek M [..] De Fauw J, Shetty S. Nature. 2020-01-01
  2. [NEWS AND VIEWS] AI shows promise for breast cancer screening. Pisano ED. Nature. 2020-01-01
  3. [ブログ] International evaluation of an AI system for breast cancer screening. DeepMind. 2010-01-01.
# 以下、背景、評価、課題、深層学習に利用したデータ、および、AIシステムの5項目構成

背景
  • 乳癌診断にマンモグラフィーが普及しているが、 米国において2007年から2013年の間に792,808人からの1,682,504例のデジタル・マンモグラムを米国95施設の359人の放射線医が読影した結果を分析した結果によると (Raiology, 2016)、abnormal interpretation rate (AIR)の基準を満たした放射線医は59.0%、特異性 (陰性と正しく判定した割合)の基準を満たした放射線医は63.0%と、偽陽性と偽陰性の誤判定を免れない。
  • Google HealthとDeepMind、Cancer Research UK Imperial Centre、Royal Surrey County Hospital、Northwestern Medicineなどの研究グループは今回、これまでにない大規模なデータをもとにマンモグラム読影AIを開発した。
評価
  • AI読影は誤判定を有意に低減した:偽陰性について英国コホート1.2%と米国コホート5.7%、偽陽性について英国コホート2.7%と米国コホート9.4% (英国の場合は二重読影が行われていたが、この比較結果は第1読影者の判定結果との比較であり、AI読影結果と第2読影者の結果は同等;米国の場合は一人読影)
  • 英国データで学習させたAIにて米国マンモグラムを読影させた結果は、米国放射線医による読影結果を、特異度で3.5%、感度で8.1%上回った。
  • 米国データからランダムに抽出した500例*について、Mammography Quality Standards Actに準拠した認定読影医6名の判定 (BI-RADSスケール)との比較も行い、AUC-ROCの指標で、AI読影が、放射線医の平均的な成績を11.5%上回った  (*「深層学習に利用したデータ」の項参照)。
  • 英国のデータは2名の放射線医による二重読影のコンセンサスの結果であることから、第1読影者の判定とAI読影の判定の二重読影のシミュレーションを行い、2名の放射線医による二重読影からの判定と同等の成績を挙げ、かつ第2読影者の作業量を88%軽減可能なことが示された。
  • なお、放射線医はマンモグラムの他に被験者の病歴のデータも参考にした判定であり、また、米国での臨床判定は従来のマンモグラフィー (2D)に加えて一部3Dマンモグラフィ (トモシンセシス)も参考にした判定であるが、AI読影は最も最近のマンモグラフだけに基づいている。
  • コンピュータ支援診断 (computer-aided detection, CAD)が1998年に米国FDAが認可して以来マンモグラフィー検診の現場に広がってきたが、必ずしも読影の性能向上につながっていない (J Am Coll Radiol, 2018)。AIには、データの拡大・多様化とともに性能が向上していく可能性がある。
課題
  • 英国のデータセットは、国家レベルのプロジェクトにおける3ヶ所のセンターからの年齢層が広くコホートにおける乳癌患者への偏りが無いが、米国のデータセットは1ヶ所のセンターに由来し乳癌患者に偏っていることから、より大規模で多様なコホートを対象としたAIの学習と評価が必要である。
  • ほとんどのマンモグラムはHologic社の装置に由来することから、臨床診断に利用されているマンモグラフィー装置を網羅していく必要がある。
深層学習に利用したデータ
  • 英国:二重読影データ;2012年から2015年の間にマンモグラフィ検診を受けた被験者の10%にあたる25,865人をランダムに選択した。そのうち785人はバイオプシーを受け、414人がバイオプシーそしてまたは3年ごとの経年検診により39ヶ月年以内に乳癌と診断された。3カ所のセンターでの判定結果 (Cacner Research UKのOPTIMMデータベースから抽出 )
  • 米国:一人読影データ;2001年から2018年の被験者3,097人の規模で、そのうち1,511人がバイオプシーを受け、686人がバイオプシーそしてまたは1~2年間隔の経年検診 で27ヶ月以内に乳癌と診断された (Northwestern Medicineのデータ、非公開)。
  • 500例:マンモグラフィー検診から27ヶ月以内にバイオプシーで陽性と判定された125名と陰性と判定された125名、および、バイオプシーを受けていない250名で構成。
AIシステム (Supplementary information Fig. 3 Deep learning architectire 参照)
  • 3種類の深層学習モデル (lesion modern > breast model > case model)に基づく;主要なコンポーネントをTensolFlowWebサイト)で公開