[出典] ”Combining AI and Crispr Will Be Tranformational" Doudna J. WIRED. 2024-11-26 5:10 AM. [The WIRED World in 2025の号から] https://www.wired.com/story/combining-ai-and-crispr-will-be-transformational/
ノーベル化学賞受賞のJennifer Doudnaが、AIと機械学習がCRISPRの応用を変革し、より迅速なゲノムエディターの発見を促進し、遺伝子編集の精度を高めていると述べている。AIが鎌状赤血球症をはじめとする疾患に対するCRISPRに基づく治療を加速させ、さらに、医療にとどまらず、気候変動対策、バイオマニュファクチャリングの改善、レジリエントな農作物の作出などが期待され、つの極めて重要な技術が融合して、科学とイノベーションが再定義されようとしている。
[詳細]
2025年は、AIと機械学習が、医療、農業、気候変動、そしてこれらの分野を支える基礎研究において、CRISPRゲノム編集のインパクトを増幅し始めるのを目にするだろう。前もって言っておくが、AIの分野はこのように大きな約束で溢れている。どんな大きな新技術の進歩にも必ず誇大広告のサイクルがあり、私たちは今そのサイクルの中にいる。多くの場合、AIの恩恵は何年か先の未来にあるが、ゲノム学やライフサイエンス研究においては、今まさに現実の影響を目の当たりにしている。
Doudnaの専門分野であるCRISPR遺伝子編集やゲノミクスでは、膨大なデータセットを扱うことが多い。スーパーコンピューターは、与えられた質問に対してデータのサブセットを分析するのに数週間から数ヶ月かかることがある。AIと機械学習はすでにこのような制限を取り払いつつあり、DoudnaらはAIツールを使って大規模なゲノムデータセットを迅速に検索し、発見している。
Doudnaの研究室では最近、AIツールを使って、公共のゲノム・データベースで発見されずに放置されていた小さな遺伝子編集タンパク質を発見した [crisp_bio 2024-07-20 参照]。Doudnaが10年前にカリフォルニア大学バークレー校に設立した研究機関であるInnovative Genomics Instituteのグループは、最近、電気工学・コンピューター科学科(EECS)および計算生物学センターのメンバーと協力し、人気のあるチャットボットの多くが使用しているような大規模な言語モデルを使用して、天然配列に比べて耐熱性の高い新しい機能性RNA分子を予測する方法を開発した [*]。科学者たちがここ数十年の間に築き上げてきた膨大なゲノムや構造データベースから、他にどんな発見が待っているのか想像してみてほしい。
このような発見は、実社会への応用が可能である。上記の2つの例では、より小さなゲノムエディターは、細胞内への治療薬の効率的な送達に役立ち、熱安定性RNA分子の予測は、医薬品やその他の価値ある製品を生み出すバイオ製造プロセスの改善に役立つ。
医療と医薬品開発においては、最近、鎌状赤血球症に対する初のCRISPRを用いた治療法が承認された。AIは、最適な編集ターゲットを予測し、CRISPRの精度と効率を最大化し、オフターゲット効果を低減することで、開発プロセスを加速させることができる。他の分野、例えば農業分野でも、AIを活用したCRISPRの進歩により、よりレジリエントで、生産性が高く、栄養価の高い作物の創出が期待され、より大きな食糧安全保障が確保されるとともに、研究者が最も実りあるアプローチに集中することで、市場投入までの時間が短縮される。気候変動分野では、AIとCRISPRが、自然炭素の回収と環境の持続可能性を改善するための新たな解決策を切り開く可能性がある。
医療と医薬品開発においては、最近、鎌状赤血球症に対する初のCRISPRを用いた治療法が承認された。AIは、最適な編集ターゲットを予測し、CRISPRの精度と効率を最大化し、オフターゲット効果を低減することで、開発プロセスを加速させることができる。他の分野、例えば農業分野でも、AIを活用したCRISPRの進歩により、よりレジリエントで、生産性が高く、栄養価の高い作物の創出が期待され、より大きな食糧安全保障が確保されるとともに、研究者が最も実りあるアプローチに集中することで、市場投入までの時間が短縮される。気候変動分野では、AIとCRISPRが、自然炭素の回収と環境の持続可能性を改善するための新たな解決策を切り開く可能性がある。
まだ始まったばかりだが、AIとCRISPRという、間違いなく現代で最も深遠な2つのテクノロジーの力を適切に利用できる可能性は明らかであり、それはすでに始まっている。
[*]
RNA言語モデルはRNAの機能を向上させる変異を予測する
[出典] "RNA language models predict mutations that improve RNA function" Shulgina Y, Trinidad MI, Langeberg CJ, Nisonoff H, Chithrananda S, Skopintsev P, Nissley A [..] Cate JHD. bioRxiv. 2024-09-26 (preprint). https://doi.org/10.1101/2024.04.05.588317
[出典] "RNA language models predict mutations that improve RNA function" Shulgina Y, Trinidad MI, Langeberg CJ, Nisonoff H, Chithrananda S, Skopintsev P, Nissley A [..] Cate JHD. bioRxiv. 2024-09-26 (preprint). https://doi.org/10.1101/2024.04.05.588317
構造化RNAは、遺伝子発現から触媒作用に至るまで、多くの中心的な生物学的プロセスの中心にある。ディープラーニングの進歩により、正確なタンパク質構造モデルの予測が可能になった一方で、RNA構造予測は、高品質な参照データが豊富にないため、現時点では不可能である1。さらに、利用可能な配列データは一般的に、RNAの機能を知ることができる生物の表現型と関連付けられていない2-4。私たちは、Genome Taxonomy Database(GTDB)5と連携したRNA構造・機能解析のための新しいデータベース、GARNET(Gtdb Acquired RNa with Environmental Temperatures)を作成した。GARNETは、GTDBゲノム由来のRNA配列と、GTDB参照生物の実験および予測された最適生育温度をリンクしている。
これにより、機械学習に利用できる深く多様なRNA配列アラインメントの構築が可能となる。GARNETを用いて、配列と構造を考慮したRNA生成モデルの最小要件を定義する。また、RNAのGPTライクな言語モデルを開発し、オーバーラップする三重項トークン化により最適な符号化を行う。GARNETの超好熱性RNAとこれらのRNA生成モデルを活用し、大腸菌のリボソームに耐熱性を向上させるリボソームRNAの変異を同定した。ここで紹介するGTDB由来のデータとディープラーニングモデルは、RNAの配列、構造、機能のつながりを理解するための基盤となる。
コメント