誰でもタンパク質の構造を手に入れられる - AIによってタンパク質がその形を見つけ出す
次点にCOVID-19の飲み薬,COVID-19を含む感染症の抗体治療薬,CRISPRによる遺伝子治療など
[出典] 2021 BREAKTHROUGH OF THE YEAR "Protein structures for all - AI-powered predictions show proteins finding their shapes" Service R. Science 2021-12-16. https://doi.org/10.1126/science.acz9822

 クリスチャン・アンフィンセンは1972年のノーベル化学賞受賞に際して,「タンパク質の構造を,そのアミノ酸配列から予測できるようになるだろう」と述べた.それから50年も経たないうちに,アミノ酸配列だけからタンパク質構造を正確に作り出せるようになった.
 その間に,ホモロジーモデリングや共進化理論に基づくモデリングなどが成果を上げ,2年ごとに開催されてきた「タンパク質構造予測コンテスト(CASP:Critical Assessment of protein Structure Prediction)」において,モデルの評価スコアが60を下回るところから70点台半ばのスコアを出すことが多くなってきたところに,DeepMind社が開発したAIをベースとするAlphaFoldが登場し,中央値で80近くを叩き出した.2020年に登場した後継のAlphaFold2は,中央値で92.4と,今度は,実験的構造解析に匹敵するスコアを叩き出した.
 DeepMindに続いて7月中旬にDavid BakerのチームがAI構造予測プログラム「RoseTTAFold」を開発し,創薬標的とされている数百のタンパク質の構造を報告した.その1週間後に,DeepMindのグループが,ヒトの全タンパク質の44%に相当する35万個のタンパク質の構造を報告した.AI予測構造は今後数ヶ月で,すべての生物種にわたって存在する全タンパク質のほの半数にあたる1億個まで増えるだろう.
 タンパク質構造予測の次のステージは,タンパク質間相互作用の予測であるが,すでに,10月にはDeepMindがプレプリントで4,433個のタンパク質複合体を報告し,11月にはRoseTTAFoldがさらに912の複合体を追加した.
 AlphaFold2とRoseTTAFoldのコードは現在公開され,一気に,応用が広がっている.11月に,ドイツと米国の研究者がAlphaFold2とクライオ電顕を利用して,30種類のタンパク質の集合体である核膜孔複合体の構造を報告した.8月には,中国の研究者がAlphaFold2を用いて,DNAに結合する約200種類のタンパク質の構造を解析した.David Bakerのチームは,RoseTTAFoldを利用して,安定した構造に折り畳まれる新しいタンパク質配列を考案した.また,グーグルの親会社であるアルファベットが11月に,AI予測構造を利用して新薬の候補を設計する新しいベンチャー企業を立ち上げた.新型コロナウイルスの研究者は,AlphaFold2を利用して,オミクロン変異体のスパイクタンパク質の変異がウイルスの特性に及ぼす影響を解析している.
 タンパク質を巡る研究において,生体内でのタンパク質のダイナミックスの予測や,巨大な多タンパク質複合体の可視化などが未だ課題であるが,AIがもたらしたこの進歩は,生物学と医学の見たこともないパノラマを見せてくれるだろう.
 [関連crisp_bio記事]
 [ブレークスルー賞次点から抜粋]
 1. Potent pills boost COVID-19 arsenal (ファイザーとメルクの飲み薬). Couzin-Frankel J.
 2. Artificial antibodies tame infectious diseases (感染症に対するモノクローナル抗体治療薬).Cohen J.
 3. CRISPR fixes genes inside the body (ヒト体内での遺伝子治療).Kaiser J.

 鎌状赤血球症とβサラセミア
 遺伝性ATTRアミロイドーシス (Intellia TherapeuticsとRegeneron Pharmaceuticals)
 レーバー先天性黒内障 (Editas Medicine)