タンパク質構造は配列を超えて保存されているため、遠縁のタンパク質を解析するには多重構造アライメント(MSTA)が不可欠である。近年、深層学習や大規模言語モデル(LLM)により利用可能なタンパク質構造のレポジトリーが大幅に拡充された(AlphaFold DB や ESMAtlas)ことから、従来よりも画期的に高速かつ高精度なMSTA手法が必要になってきた。今回、Seoul National UniversityのMartin Steinegger准教授、ポストドクのCameron Gilchrist研究員、並びにMilot Mirdita博士(現 Sungkyunkwan University助教授)が、Science 誌刊行論文にて、数十万ものタンパク質構造の多重アライメントに向けて、ペアワイズ構造アライナーFoldseekとTM-align [Nucleic Acids Res 2005 ] を活用した並列プログレッシブアライメント(parallelized progressive alignment)による革新的なMSTA手法 FoldMason を紹介している。
- FoldMasonは、最先端のMSTA手法と同等かそれ以上のアライメント品質を実現しながら、2桁以上(約100〜1,000倍)の高速化を実現している。
- フラビウイルス科の糖タンパク質を用いて、FoldMasonのMSTAが、アミノ酸配列の類似度が極めて低い「トワイライトゾーン」も含めて、系統解析可能なことが実証されている。
FoldMasonは無料のオープンソースソフトウェアであり、また、対話型で利用可能なWebサイトも用意されている [右図はWebサイトのスクリーンキャプチャ;mason = レンガ職人]。
[出典]
- "Multiple protein structure alignment at scale with FoldMason" Gilchrist CLM, Mirdita M, Steinegger M. Science. 2026-01-29. https://doi.org/10.1126/science.ads6733 [所属] Seoul National University (School of Biological Sciences; Interdisciplinary Program in Bioinformatics; Institute of Molecular Biology and Genetics; Artificial Intelligence Institute), Korea Basic Science Institute
コメント