[出典] Pan-cancer computational histopathology reveals mutations, tumor composition and prognosis. Fu Y [..] Gerstung M. bioRxiv. 2019-10-25

 癌の診断は、主としてヘマトキシリン・エオジン染色 (H&E染色)が施されたサンプルの組織病理画像に元にした時代を経て、ゲノム、エピゲノム、トランスクリプトームおよびプロテオームの分子データが加わることで、グレードの判定と予後判定がより精密になり、また、この部分の自動化が進んてきた。組織病理的画像に基づくグレード判定と予後判定についても、近年、デジタル画像処理と深層学習の進展により、専門医の判定に整合する自動判定が実現しつつある [1-3]

 これまで、組織病理画像診断の自動化を目指す深層学習の研究が限られた腫瘍型を対象としてきたところ、EMBL-EBIとAddenbrooke’s Hospital (UK)の研究グループは、28種類の腫瘍に由来するH&E染色サンプルの組織病理画像から、深層転送学習に基づいて、遺伝的変異や腫瘍組織の構成の同定、さらには予後判定も可能なことを示し、今回開発した手法を、汎がんコンピュータ組織病理学 (Pan-cancer computational histopathology, PC-CHiP)としてbioRxivに投稿した 。
  • はじめに、TCGAから、ゲノム、トランスクリプトームならびに臨床・予後のデータ・情報を伴っているH&E染色凍結組織の画像17,396例を抽出した。このデータセットは28種類の腫瘍組織と14種類の正常組織を網羅するに至った。
  • PC-CHiPのコアには定評あるCNNモデルの一つであるInception-V4 (解説arXiv投稿)を採用し、~1,400万のタイル (512 x 512ピクセルの画像)の分類を可能にするように学習を進めることで得られた最適アルゴリズムにより、各タイルを1,536種類の画像の特徴の組み合わせで数値化するに至った (Figure 1-a引用下図参照)。2019-10-28 16.13.21
  • 組織病理画像の数値化によって、画像が由来する組織の同定に加えて腫瘍組織と正常組織の精密な自動識別が可能になった (Figure 1 bとe 引用下図参照)。 2019-10-28 16.15.21
  • UMAPを利用して多様体学習に基づく次元縮約を実現し、組織病理学的特徴1,536種類に基づく腫瘍組織と正常組織の2次元マップも作成した (Figure 1c と d引用下図参照)。2019-10-28 16.17.33
  • PC-CHiPにより、組織病理画像と、癌でよく見られる遺伝的変異*との間に存在する相関も明らかになった  (* 全ゲノム重複 (WGDs); 染色体腕レベルでのコピー数獲得と損失; 遺伝子の増幅 (focal amplification)と欠失; ドライバー遺伝子の変異:Figure 2引用下図参照)。2019-10-28 16.19.03
  • PC-CHiPは、組織病理画像と転写プロファイルの特徴の対応関係も明らかにし、各スライドごとに、組織病理画像のパターンから間質組織や腫瘍浸潤リンパ球 (tumor infiltrating lymphocytes, TIL)の局在の自動同定も可能にした (Figure 3引用下図参照)。2019-10-28 16.20.09
  • PC-CHiPはまた殆どの癌型において、予後と相関するパターンを認識可能にし、ひいては、これまでの専門医による組織病理学サブタイプとグレード分類 (historical grading)や予後判定と整合しつつより高精度な分類と判定が可能なことを示した (Figure 4引用下図参照)。2019-10-28 16.21.24
  • PC-CHiPにより、組織病理データと分子データの自動的統合解析が可能になり、癌診断のワークフローを強化するに至った。