[出典] "A White-Box Machine Learning Approach for Revealing Antibiotic Mechanisms of Action" Yang JH, Wright SN, Hamblin M [..] Collins JJ. Cell 2019-05-09.

背景
  • 機械学習によって、生体信号 (biological signals)と実験測定したフェノタイプの相関関係を明らかにすることが可能になったが、因果関係を明らかにするには至っていない。近年、診断医療分野への応用が広がっているニューラルネットから発展してきた深層学習によるAIも、結論に至った判断根拠を説明できない「ブラックボックス(*)」であることから「説明可能なAI(Explainable artificial intelligence)」が、「ホワイトボックス」型AIとして注目を集め、また議論を呼んでいる(* crisp_bio 2017-05-02 ブラックボックスである人工知能を開けて見たい)。
  • 一方で、抗生物質による感染症治療は、多剤耐性菌の蔓延に、変革を迫られており、抗生物質の新たな作用機序の同定が試みられている。近年、抗生物質がバクテリアを細胞死へ誘導する経路として、DNA複製や細胞壁形成を直接阻害することでバクテリアを細胞死へ誘導する直接的経路に加えて、代謝反応を含む標的の直接阻害の下流の経路も関与することが明らかにされてきた (以下、間接的経路)。
成果概要
  • MIT、Broad Institute、Technical University of Denmark、Harvard University、Boston University、UCSDの研究グループは、抗生物質研究を目的とした生化学スクリーンとネットワークモデリングを組み合わせたホワイトボックス型機械学習プラットフォームを開発することで、間接的経路が、抗生物質によるヌクレオチドプールの恒常性破綻を契機とするヌクレオチド生合成経路活性化のポジティブ・フィードバック回路(**)が形成されることによることを明らかにした。
  • (**) ヌクレオチドプール障害> アデニンレベル低下 > プリン塩基生合成の活性化 > ATP要求性の亢進 > 中心炭素代謝と細胞呼吸の亢進 > 細胞毒性を帯びた代謝副産物 > DNAをはじめとする細胞構成要素損傷 > ヌクレオチドプール障害 (原論文 Figure 7参照)
生化学実験とモデリング
  • 抗生物質研究ホワイトボックス型機械学習プラットフォームのポイントは、機械学習アルゴリズムの入力として、生化学実験データそのものではなく、生化学実験データから、代謝経路のネットワークモデルを介して変換した代謝状態 (原論文'metabolic states'の直訳)を利用したところにある (これまでの機械学習による細胞内過程のモデリングは、与えられたジェノタイプから与えられたフェノタイプを出力するネットワークモデルを遡及的に推定)。
  • はじめに、Biolog phenotype microarraysを利用した生化学実験によって、3種類の抗生物質 (β-ラクタム系抗生物質アンピシリン; ニューキノロン系抗生物質シプロフロキサシン; アミノグリコシド系抗生物質ゲンタマイシン)と206種類の代謝物 (一連のアミノ酸、炭水化物およびヌクオチド)との全ての組み合わせ (~24,000組)ついて、E. coliの増殖を測定し、各抗生物質の致死性 (IC50)を判定した。
  • 続いて、生化学実験からのデータをもとに、今回研究に加わっているUCSD/U DenmarkのB. O. Palssonらが開発した大腸菌の代謝モデル (Mol Sys Biol 2011)、iJO1366、により代謝フラックス (~46,500種類)をシミュレーションし、抗生物質投与に依存して変動する一連の代謝状態 (原論文'metabolic states'の直訳)を予測した。
  • 生化学実験データから変換した代謝状態を教師付き機械学習 (マルチタスクElastic Net)の入力とし、3種類の抗生物質それぞれの致死性を出力する予測モデルを構築し、抗生物質の致死性に影響を与える既知経路を含む候補経路477種類を識別し、その統計的有意性を評価の上、さらに、Ecocyc v.22.0でアノテーションが付されている431種類の代謝経路と超幾何分布解析を介して照合し、13種類の代謝経路が、3種類の抗生物質のうち少なくとも1種類の抗生物質の致死性に影響を与えると判定した。