[出典] NEWS “Who will make AlphaFold3 open source? Scientists race to crack AI model - Researchers are aiming to create fully accessible versions of the latest iteration of DeepMind’s blockbuster protein-structure model.” Callaway E. Nature 2024-05-23. https://doi.org/10.1038/d41586-024-01555-x
[注] このNEWS記事の前半で、AlphaFold3の公開、その非公開性を批判する研究者からの公開書簡、およびNature誌の反応までがまとめられている [参考 crisp_bio AlphaFold3へのアクセス制限が物議を醸す https://crisp-bio.blog.jp/archives/35812663.html]
AlphaFold2のオープンソース化の論文 [*]を発表していたコロンビア大学の計算生物学者AlQuraishiの’OpenFold’チームは、年内の完成を目指して、AlphaFold3のオープンソース・バージョン [*]のコーディングを開始した 。
[*] AlphaFold2のオープンソース化: “OpenFold: retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization” Ahdritz G, Bouatta N [..] AlQuraishi M. Nat Methods 2024-05-14.
Nature誌のAlphaFold3論文の査読を担当し、また、先の公開書簡の共著者の一人でもあったFox Chase Cancer Centerの計算構造生物学者Roland Dunbrackは、「AlphaFold2のコードが公開されたことで、AlphaFold2の利用範囲が広がり、研究者がこのツールを適応させ、改良することが可能になった。ダウンロード可能なコードが欲しかったのは、私や他の研究者がアクセスできれば科学が発展するからです」、また、「AlphaFold3がどのようなリガンドにも対応できるとは思えない」と言う。また、AlQuraishiは「コードが公開されていれば、タンパク質と薬剤との相互作用をより適切にモデル化するために、モデルを再学習させることができる」と言う。
AlphaFold3のオープンソース化には、長年にわたりタンパク質構造予測の先端を走り続けてきた計算生物物理学者David Bakerも関心を持ち、そこから何を彼のチームが開発したRoseTTAFold-All-Atomと呼ばれるオープンソースのタンパク質・化学予測モデルに適用できるかを確かめたいとしている。
サンフランシスコの独立系ソフトウェア・エンジニアPhil Wanは、DeepMindの最新モデルを複製するクラウドソーシングの取り組みを始めた。Wanは、企業から資金援助を受けて、画像生成ツールDALL-Eを含む数十のAIモデルのオープンソース版を開発してきた。AlphaFold3のオープン化に取り組むオファーはまだ受けていないが、彼の3人のチームはAlphaFold3モデルを記述するコードを1ヵ月以内に完成させる予定だという。しかし、AlQuraishiは「最も時間がかかるのは、実験的に決定されたタンパク質構造やその他のデータセットを使ってモデルをトレーニングすることである」「コードの方が圧倒的に簡単です。これは労力の5%です」と言う。また、MITの進化生物学者Sergey Ovchinnikovは、AlphaFold3をDeepMindと同じ方法で学習させるためには、クラウドコンピューティングのリソースに100万米ドル以上かかると見積もっている。
AlQuraishiは、AlphaFold3のオープンソース版開発の推進が、AlphaFoldのようなツールの開発・配布をDeepMindのような企業に依存することの危険性をアカデミアに認識させることを期待し、「DeepMindが成し遂げたことことは良いことだが、それに依存すべきではない」、「アカデミアでそれを行えるような公的インフラを作る必要がある」と述べている。
コメント