タグ:機械学習-AI

[出典] A Novel Hybrid CNN-SVR for CRISPR/Cas9 Guide RNA Activity Prediction. Zhang G, Dai Z, Dai X. Front Genet. 2020-01-08.

 中山大学 (広州)の研究グループが、深層学習の手法CNNによるgRNAsの配列とエピゲノムの特徴抽出に、SVMに基づく回帰解析 (Support Vector Regression, SVR) による高次元な特徴空間からの分類器生成を組み合わせることで、4種類のヒト細胞株 [1]全てについて既存のgRNA活性予測プログラム[2]に優るプログラムを開発しhttps://github.com/Peppags/CNN-SVRから公開
  1. HCT116; HEK293T; HeLa; HL90
  2. DeepCRISPR; Seq-deepCpf1 [3]sgRNA Designer; Spacer Scoring for CRISPR (SSC) [論文 / Webサイト]; WU-CRISPR [論文 / Webサイト]
  3. CRISPRメモ_2018/02/04 [第3項] CRISPR-Cpf1 gRNA活性予測精度を、深層学習(deep learning)により向上
[参考] 原論文から3つの図を以下に引用:
Figure 1 (CNN-SVRのワークフロー概要図)1
Figure 3 (深層学習または機械学習による既存のgRNA活性予測プログラムとの比較)2
Figure 5 (gRNAの配列の各位置におけるA/T/G/Cの種類とエピゲノムの状態が、gRNAの活性に及ぼす影響の大きさを表す図)3

[出典] Near real-time intraoperative brain tumor diagnosis using stimulated Raman histology and deep neural networks. Tollon TC [..] Orringer DA. Nat Med. 2020-01-06
Neurosurgery. 2019 Sep; 66(Supplement. 1): nyz310_634

背景
  • 癌外科手術の安全と効果は術中病理診断に左右される。現在行われている術中迅速病理組織診断は、一部の先端的施設を除いて、手術室から病理診断ラボへ運ばれた検体から、熟練した技師がヘマトキシリン・エオジン染色 (HE染色)をへてスライド切片を調整し、病理医が顕微鏡画像から診断する流れをたどり、診断結果が手術室へフィードバックされるまでに、20~30分を要する。
  • 臨床現場では熟練した病理医の不足と偏在も問題である (2017年の報告によると、米国では年に1,100万件のバイオプシー検体が診断対象とされていた)。
成果
 University of Michigan、University of Miami、Columbia University、New York University、UCSFおよびInvenio Imagingの研究グループは今回、検体からの高精度な仮想的HE染色スライド切片イメージを導出可能とした誘導ラマン組織学 (stimulated Raman histology, SRH) [1]に、深層・畳み込みニューラルネットワーク (CNN)技術を組み合わせることで、ベッドサイドでの準リアルタイム (< 150秒)での術中'ほぼリアルタイム'自動診断を実現した [YouTube引用動画参照 (音声付き)]
  • CNNは、患者415人に由来するSRHイメージ250万例を、悪性神経膠腫、リンパ腫、転移腫瘍、骨髄膜腫など13種類のカテゴリーに分類する学習をさせた。
  • 3つのセンターでの前向き臨床試験278例 (脳腫瘍切除手術とてんかん手術)において、CNNによるSRH画像診断の精度は94.6%であり、従来の組織イメージに基づく病理医による診断の精度93.9%に、匹敵した。
  • CNN判定のエラーと病理医の判定エラーのタイプは異なったことから、AI (CNN)と専門家 (病理医)が共同することで、精度100%の実現も夢ではない。
  • CNNは、SRHイメージからのカテゴリー判定に加えて、腫瘍浸潤領域、腫瘍非浸潤領域および診断困難な領域をpキセル単位で識別することも可能にした。
参考論文とビデオ
  1. Rapid intraoperative histology of unprocessed surgical specimens via fibre-laser-based stimulated Raman scattering microscopy. Orringer DA [..] Camelo-Piragua S.Nat Biomed Eng. 2017-02-06
  2. ビデオ:Artificial Intelligence Improves Brain Tumor Diagnosis. YouTube (1m 24s) 2020-01-06.

出典
  1. [論文] International evaluation of an AI system for breast cancer screening. McKinney SM, Sieniek M [..] De Fauw J, Shetty S. Nature. 2020-01-01
  2. [NEWS AND VIEWS] AI shows promise for breast cancer screening. Pisano ED. Nature. 2020-01-01
  3. [ブログ] International evaluation of an AI system for breast cancer screening. DeepMind. 2010-01-01.
# 以下、背景、評価、課題、深層学習に利用したデータ、および、AIシステムの5項目構成

背景
  • 乳癌診断にマンモグラフィーが普及しているが、 米国において2007年から2013年の間に792,808人からの1,682,504例のデジタル・マンモグラムを米国95施設の359人の放射線医が読影した結果を分析した結果によると (Raiology, 2016)、abnormal interpretation rate (AIR)の基準を満たした放射線医は59.0%、特異性 (陰性と正しく判定した割合)の基準を満たした放射線医は63.0%と、偽陽性と偽陰性の誤判定を免れない。
  • Google HealthとDeepMind、Cancer Research UK Imperial Centre、Royal Surrey County Hospital、Northwestern Medicineなどの研究グループは今回、これまでにない大規模なデータをもとにマンモグラム読影AIを開発した。
評価
  • AI読影は誤判定を有意に低減した:偽陰性について英国コホート1.2%と米国コホート5.7%、偽陽性について英国コホート2.7%と米国コホート9.4% (英国の場合は二重読影が行われていたが、この比較結果は第1読影者の判定結果との比較であり、AI読影結果と第2読影者の結果は同等;米国の場合は一人読影)
  • 英国データで学習させたAIにて米国マンモグラムを読影させた結果は、米国放射線医による読影結果を、特異度で3.5%、感度で8.1%上回った。
  • 米国データからランダムに抽出した500例*について、Mammography Quality Standards Actに準拠した認定読影医6名の判定 (BI-RADSスケール)との比較も行い、AUC-ROCの指標で、AI読影が、放射線医の平均的な成績を11.5%上回った  (*「深層学習に利用したデータ」の項参照)。
  • 英国のデータは2名の放射線医による二重読影のコンセンサスの結果であることから、第1読影者の判定とAI読影の判定の二重読影のシミュレーションを行い、2名の放射線医による二重読影からの判定と同等の成績を挙げ、かつ第2読影者の作業量を88%軽減可能なことが示された。
  • なお、放射線医はマンモグラムの他に被験者の病歴のデータも参考にした判定であり、また、米国での臨床判定は従来のマンモグラフィー (2D)に加えて一部3Dマンモグラフィ (トモシンセシス)も参考にした判定であるが、AI読影は最も最近のマンモグラフだけに基づいている。
  • コンピュータ支援診断 (computer-aided detection, CAD)が1998年に米国FDAが認可して以来マンモグラフィー検診の現場に広がってきたが、必ずしも読影の性能向上につながっていない (J Am Coll Radiol, 2018)。AIには、データの拡大・多様化とともに性能が向上していく可能性がある。
課題
  • 英国のデータセットは、国家レベルのプロジェクトにおける3ヶ所のセンターからの年齢層が広くコホートにおける乳癌患者への偏りが無いが、米国のデータセットは1ヶ所のセンターに由来し乳癌患者に偏っていることから、より大規模で多様なコホートを対象としたAIの学習と評価が必要である。
  • ほとんどのマンモグラムはHologic社の装置に由来することから、臨床診断に利用されているマンモグラフィー装置を網羅していく必要がある。
深層学習に利用したデータ
  • 英国:二重読影データ;2012年から2015年の間にマンモグラフィ検診を受けた被験者の10%にあたる25,865人をランダムに選択した。そのうち785人はバイオプシーを受け、414人がバイオプシーそしてまたは3年ごとの経年検診により39ヶ月年以内に乳癌と診断された。3カ所のセンターでの判定結果 (Cacner Research UKのOPTIMMデータベースから抽出 )
  • 米国:一人読影データ;2001年から2018年の被験者3,097人の規模で、そのうち1,511人がバイオプシーを受け、686人がバイオプシーそしてまたは1~2年間隔の経年検診 で27ヶ月以内に乳癌と診断された (Northwestern Medicineのデータ、非公開)。
  • 500例:マンモグラフィー検診から27ヶ月以内にバイオプシーで陽性と判定された125名と陰性と判定された125名、および、バイオプシーを受けていない250名で構成。
AIシステム (Supplementary information Fig. 3 Deep learning architectire 参照)
  • 3種類の深層学習モデル (lesion modern > breast model > case model)に基づく;主要なコンポーネントをTensolFlowWebサイト)で公開

[出典] The functional landscape of the human phosphoproteome. Ochoa D [..] Beltrao P. Nat Biotechnol. 2019-12-09. < bioRxiv. 2019-02-05
# crisrp_bio注:  (*) the phosphosite functional score; 本記事に引用したFigure 1はbioRxiv投稿版からCC  BY 4.0のライセンスで引用(Nature Biotechnolgy版と同一)

 タンパク質のリン酸化は殆どの生物過程の制御に関与する翻訳後修飾であり、その異常は疾患を引き起こす。ヒトにおけるリン酸化の全貌は解き明かされておらず、質量分析を介したリン酸化部位の同定が精力的に進められている。例えば、単独の細胞 (HeLa細胞)を対象とする"ultradeep phosphoproteome" (論文データベース)から、50,000種類を超えるリン酸化ペプチドが同定され、プロテオームの75%がリン酸化されていることが示唆され、こうした研究から同定された200,000ヶ所を超えるリン酸化部位が、PhosphoSitePlus (PSP)といったデータベースに収録されている。
 リン酸化部位の同定が進行する一方で、各部位のリン酸化の生物学的意味の解明はこれからである。リン酸化の保存性は低いとされることから、細胞のフィットネスに関与するのは一部のリン酸化であることが示唆される。そこで、保存性、位置などの特徴や変異導入実験などから、重要な機能を担っていると思われるリン酸化部位からその機能を同定する試みがされているが、プロテオーム・ワイドでの機能同定までの道は通い。

 EBI, EMBL, Gladstone Institutes/Quantitative Biosciences Instituteの英独米の研究グループは今回、機械学習によるリン酸化の生物学的意味の解明を試みた。
  • PRIDEデータベース (論文データベース)に由来する104種類のヒトの細胞型そしてまたは組織から同定されたリン酸化されているタンパク質のデータセット112種類をマニュアルで評価し、設定した品質基準を満たした6,801種類のプロテオミクス実験を再解析し、ヒトにおける119,809ヶ所のリン酸化部位を網羅したレファランス・プロテオームを構築した (再解析した結果の概要について、Figure 1引用下図参照)。in-vivo human phosphosites
  • レファランス・プロテオームでは、各リン酸化部位について、質量分析のデータ (スペクトルカウントと局在)、制御関係のデータ (キナーゼのモチーフとのマッチングなど)、構造上の環境、進化上の保存性の4種類のカテゴリーからの59種類の特徴に基づいて定義したフィットネスへの貢献を示すスコア、the phosphosite functional score (以下、PFS)、が付与されている。PFSの定義は、PSPでキュレートされタンパク質の機能制御に関与することが明らかにされている2,638ヶ所のリン酸化部位のデータをもとに、Gradient Boostingに基づく機械学習モデルに依った。
  • PFSに基づいて、LCKキナーゼ、STATS3転写因子、PTPN11ホスファターゼ、H2AFXヒストンにおいてタンパク質の機能制御に関与するリン酸化部位を正確に同定した。また、その変異が疾患をもたらすリン酸化部位の同定も可能にした。SWI/SNFクロマチン再構成複合体 (chromatin remodeling complex)のメンバーであるSMARCC2において、神経細胞分化を制御するリン酸化部位をPFSに基づいて推定し、マウスでの実験で裏付けることにも成功した。
  • Reference proteomeデータ入手先:Supplementary Tables https://www.nature.com/articles/s41587-019-0344-3#Sec30
    関連プログラム入手先: GitHub funscoR - R package for functionally scoring phosphorylation sites https://github.com/evocellnet/funscoR

1. [ミニ豚2型糖尿病モデル] Preparation of a new type 2 diabetic miniature pig model via the CRISPR/Cas9 system. Zou X, Ouyang H [..] Chen C. Cell Death Dis. 2019-10-28
  • 吉林大学の研究グループが、Cas9 相同組み換えと体細胞核移植を経て (Fig. 3引用下図参照)、hIAPP
    ヒトの膵島アミロイドポリペプチド (human islet amyloid polypeptide, hIAPP )*を帯びたhIAPPミニ豚モデルを樹立した (* hIAPPの蓄積は2型糖尿病の主因とされている)。
2. [デリバリー] Carboxylated nanodiamond-mediated CRISPR-Cas9 delivery of human retinoschisis mutation into human iPSCs and mouse retina. Yang TC, Chang CY, Yarmishyn AA [..] Tzeng Y, Chang CC, Chiou SH. Acta Biomater. 2019-10-28
  • 台北栄民総医院、交通大学、成功大学、陽明大学などの台湾の研究グループが、DNA、タンパク質および薬剤の比較的安定な炭素材料とされてきたナノダイヤモンド (nanodiamond, ND)をキャリア(*)とするCRISPR/Cas9遺伝子編集により、ヒトiPSCsとマウス網膜へのX染色体連鎖性若年網膜分離症 (X-linled juvenile retinoschisis: XLRS)の原因となるRS1変異 (c.625C>T)の導入を実現し、このモデルマウスにて光受容体の構造異常などのXLRSの症状を再現した。
  • (*) 表面をカルボシキル化した3 nm径のNDに予め結合させたmCherry-Hisタグに、Cas9とGFPレポータをコードしたDNA鎖と、sgRNAをコードしたDNAとRS1 c.625C>T変異を帯びたHDRテンプレートからなるDNA鎖を、それぞれ共有結合させる。このNDの標的細胞への内在化の効率が、ウシ血清アルブミンを混合することで顕著に向上した。
3. [PAMs同定] Efficient cleavage resolves PAM preferences of CRISPR-Cas in human cells. Tang L [..] Gu F. Cell Regeneration. 2019-10-28.
  • 温州医科大学と河南大学の研究グループが、PAMの網羅的スクリーニング法として、dCas9に依存する“PAM-SCANR(PAM screen achieved by NOT-gate repression)” に変えて、Cas9の活性からPAMを判定するPAM-DOSE (PAM Definition by Observable Sequence Excision) 法を開発して、SpCas9, Cas12a (FnCas12a, AsCas12a, LbCas12a and MbCas12a) とSpCas9-NGのそれぞれについて有効なPAMsを同定した。
4. [酵母ゲノム編集ミニレビュー] Enhanced scale and scope of genome engineering and regulation using CRISPR/Cas in Saccharomyces cerevisiae. Deaner M, Alper HS. FEMS Yeast Research. 2019-10-26.
  • テキサス大学オースティン校の研究チームが、S. cerevisiaeを解析対象として、CRISPR技術の基本、遺伝子ターゲッティング、プール型ライブラリによるゲノムスケールでの遺伝子編集と転写調節、および、代謝工学への応用をレビューした。
5. [オフターゲット予測] Prediction of off-target specificity and cell-specific fitness of CRISPR-Cas System using attention boosted deep learning and network-based gene feature. Liu Q, He D, Xie L. PLoS Comput Biol. 2019-10-28
  • ニューヨーク州立大学の研究チームが深層学習の手法 (attention boosted deep learning)に、遺伝子の細胞型に特異的な機能の知識ベースを融合することで、Cas9とCas12aを対象とするオフターゲット編集予測AttnToMismatch_CNNモデル と細胞型ごとのオンターゲット編集活性予測モデルAttnToCrispr_CNNモデルを開発し、DeepCrisprやDeepCpf1など既存のモデルに優ることを示した。
6. [特許公開] US 2019322993 A1 Thermostable Cas9 Nucleases.
  • 公開日 2019-20-24;発明者 Van Der OS, Van Kranenburg R, Bosma EF, Mougiakos I, Mohanraju P. ;権利者 Wageningen Universiteit, Stiching Voor De Technische Wetenschappen (Ultrecht)
  • 好熱菌Geobacillus thermodenitrificans T12のタイプIICシステムのエフェクターにより、 20° ~ 100° Cの温度域でのゲノム編集を実現
  • [論文紹介crisp_bio記事]CRISPRメモ_2017/11/24-2 [第3項] ThermoCas9:熱安定なCas9の同定と特性
7. [化学療法耐性機構の個人差] Integrated Chromatin and Transcriptomic Profiling of Patient-Derived Colon Cancer Organoids Identifies Personalized Drug Targets to Overcome Oxaliplatin Resistance. Tung KL, Chen KY, Negrete M  [..] Shen X. Genes & Diseases. 2019-10-29
  • コーネル大学とデューク大学の研究グループが、患者由来の大腸癌オルガノイドにおいて、ATAC-seqとRNA-seqから、クロマチンアクセシビリティを有意に増し、遺伝子発現を亢進する一連の遺伝子群を同定した。
  • その中で、線維芽細胞増殖因子受容体1 (FGFR1)とオキシトシン受容体 (OXTR)をサイレンシングすると、オキサリプラチン耐性の抑制が可能であり、また、オキサリプラチンにFGFR1阻害剤 (PD166866)またはOXTRのアンタゴニスト (L-368,899)を併用することでも、オキサリプラチン耐性オルガノイドを抑制することを見出した。
  • 一方で、他の患者由来のオキサリプラチン耐性オルガノイドには、FGFR1の発現亢進もOXTRの発現亢進も見られず、オキシプラチン耐性を抑制する標的足り得ないことも見出した。

↑このページのトップヘ