2024-02-02 原著論文のハイライト記事の書誌情報を追記:"Mining the chemcal space for new atnibiotics" Chirigati F. N. Nat Comput Sci. 2024-02-22. https://doi.org/10.1038/s43588-024-00591-x
2023-12-25 Nature 誌刊行論文とNature Research Briefing記事に準拠した初稿
[出典]
  • 論文 "Discovery of a structural class of antibiotics with explainable deep learning" Wong F, Zheng EJ [..] Collins JJ. Nature 2023-12-20. https://doi.org/10.1038/s41586-023-06887-8 [著者所属] Broad Institute, MIT, Integrated Biosciences, Harvard U, Leibniz Institute of Polymer Research and the Max Bergmann Center of Biomaterials.
  • RESEARCH BRIEFINGS (論文著者らによる解説) "‘Explainable’ AI identifies a new class of antibiotics" Nature 2023-12-20. Wong F, Collins JJ. https://doi.org/10.1038/d41586-023-03668-1
[背景]

 抗生物質耐性菌の登場と蔓延により、2050年には感染症死亡者が全世界で1,000万人に達すると予測されている。これまで抗生物質は、放線菌などからの天然物スクリーニングに始まり、ハイスループットスクリーニング、進化・系統解析、構造情報に基づく合理的設計、機械学習によるin silicoスクリーンにングなど様々な手法が開発されてきたが、近年、新たな構造クラスを帯びた抗生物質の発見は極めて稀になってきた。

 著者らは先行研究で、膨大な化合物ライブラリーからAI (深層学習) を利用して、新規抗生物質候補を発見可能なことを実証してきた。具体的には、約6,000分子からなるDrug Repurposing Hubと、約1億700万分子からなるZINC15ライブラリーの抗菌化合物から、Aiを利用して、halicinとaboucinを発見した [*1]。

 著者らが先行研究で利用したAIの手法は、グラフ・ニューラル・ネットワーク [*2]のプラットフォームであるChempropであったが、これはいわゆるブラックボックス・モデルであり、新規クラスの抗生物質発見の手がかりとなる化学的洞察は得られなかった。

 そこで著者らは今回、抗生物質の新しい構造クラスを予測できるグラフ・ニューラル・ネットワークの開発を目指した。論文表題にある「説明可能な / explainable」とは、グラフ・ニューラル・ネットワークによるモデルが、その予測に到達するために実行する意思決定ステップのパターンを明らかにする(解釈可能性)、またはそのような予測を人間に理解可能にする(説明可能性)ことを意味し、ここでは、抗生物質の新たな構造を予測可能にする部分構造を同定することを意味する。

[*]
1. crisp_bio紹介記事
2. グラフ・ニューラル・ネットワークモデル
計算科学でいうグラフは、頂点と辺で構成されるデータを表し、グラフ・ニューラル・ネットワークは、グラフとして表現された化学構造から抗菌活性などの情報を推論するニューラルネットワークモデルである

[成果]

 はじめに、39,312種類の構造的に多様な低分子化合物 (分子量40~4,200ダルトン) の、実験室培養における黄色ブドウ球菌の増殖阻止能力と、3種類のヒト細胞(肝がん細胞、初代骨格筋細胞、肺線維芽細胞) を死滅させる傾向を実験的に評価した。

 次に、それぞれのデータセットに対してグラフ・ニューラル・ネットワークを学習させ、得られたモデルを用いて、12,076,365化合物の抗生物質活性とヒト細胞に対する毒性を予測した [RESEARCH BRIESINGS挿入図 または 論文Figure1 a参照]。

 その結果から、予測された抗生物質活性が高いこと、予測された細胞毒性が低いこと、構造的新規性が高いこと、および好ましい医薬化学的特性に基づいて化合物をフィルタリングし、3,646化合物を得た。

 ブラックボックスを開けるためには、予測の「根拠」を計算によって特定する検索法を開発した。すなわち、原子や結合を繰り返し除去して得られる部分構造をスコア化し、予測スコアの大部分を占めているかどうかを判定する手法であり、同様の検索方法が、AlphaGoなど他の深層学習モデルにも使用されている。

 380種類の化合物について「根拠」を計算し、283種類の化合物を実験で評価した結果、同定された「根拠」が抗生物質活性に関連する保存された構造的特徴を表しており、抗生物質の構造的クラスを予測していることが確認された。

 これらの構造クラスの化合物のうち、1つはメチシリン耐性黄色ブドウ球菌 (MRSA) およびバンコマイシン耐性腸球菌に対して選択的であり、実質的な耐性を回避し、MRSAの皮膚および全身性大腿筋内感染症のマウスモデルにおいて細菌力価を低下させた。

 本研究で確立したアプローチは、抗ウイルス剤、抗がん剤、抗老化剤など、他の創薬にも役立つ可能性がある。