[出典] REVIEW "Health research in the era of artificial intelligence: Advances in gene-editing study" Dai M, Li X, Zhang Q, Liang T, Huang X, Fu Q. Medicine Plus. 2024-04-02. https://doi.org/10.1016/j.medp.2024.100027 [所属] Zhejiang USchool of Medicine
近年、CRISPR/Cas9に代表される遺伝子編集技術が画期的な進歩を遂げている。その中で、CRISPR/Cas9技術から派生した塩基編集 (BE) 技術は、DNA二本鎖切断を起こすことなく、特定のゲノム部位で効率的な一塩基置換を実現する技術である。BEシステムは、効率的な一塩基編集からハイスループットスクリーニングへ、そしてin vitroからin vivoへの応用へと、ここ数年で急速に進化してきた。特に、BEスクリーニングシステムは、一塩基分解能での機能的ゲノム研究を容易にし、遺伝子機能に関するこれまでにない洞察を提供している。一方、AIの急速な進歩は、ゲノム編集を支援し、BEシステム内のデータ解析を合理化する上で極めて重要な役割を果たしている。本総説では、遺伝子編集研究の最近の進歩を網羅し、BE技術の開発に焦点を当て、BEに基づく一塩基レベルでの機能的ゲノム研究を探求し、機能的ゲノム研究とAIの潜在的相乗効果を強調する。
[構成]
1. Introduction
2. Base editing-based high-throughput screening
2.1. CRISPR/Cas9 and base editing
2.1.1. CRISPR/Cas-mediated gene editing
2.1.2. CRISPR/Cas-mediated base editing
2.1.3. CRISPR/Cas-mediated prime editing
2.2. Application of base editing in high-throughput screening for functional genomics
2.2.1. Simulate single-nucleotide variant (SNV) relative mutation screening
2.2.2. Base editing-mediated stop code mutation screening
2.2.3. Functional post-translation modification screening
2.2.4. Base editing-based saturation mutagenesis screening
2.3. Limits of base editing screening
3. AI-facilitated genome editing
3.1. Overview of AI
3.2. AI in health research
3.2.1. Protein structure prediction by AlphaFold2
3.2.2. Functional protein mining by protein structure clustering
3.3. AI and genome editing
他の領域と同様に、遺伝子編集の領域でもAIの利用が広がっている。膨大な遺伝子編集データを解析し、複雑なパターンを解明し、根底にある規則性を明らかにする上で、AIアルゴリズムが極めて重要な役割を果たしている。同時にAI技術は、遺伝子編集結果の実現可能性と安全性を予測する上で重要な役割を果たし、その結果、試験と検証プロセスの時間とコストを削減する。特に、ディープラーニングアルゴリズムは、塩基編集およびPEの編集効率の評価において顕著な有効性を示し[crisp_bio 2023-05-08;crisp_bio 2023-01-27]、AIと遺伝子編集の融合における重要なマイルストーンとなっている。
3.3.1. AI-based analysis of genome editing results
遺伝子編集のオフターゲット効果を低減するために、いくつかのコンピューターシミュレーションツールが考案されている。例えば、塩基エディターのオフターゲット部位を予測するためにBEdeepoffと呼ばれる新しいツールが開発された。この革新的なアプローチでは、研究者らがABEとCBEの一連のgRNAオフターゲットペアを設計し、それらをヒト細胞に安定的に導入し、続いて、ABEとCBEの両方について、編集後の効率データセットが作成された。これらのデータセットをディープラーニングモデルの学習に使用した結果、ABEdeepoffおよびCBEdeepoffとして知られる正確な予測モデルが作成された。これらのモデルは、オフターゲット部位を確実に予測し、塩基編集手順中の意図しない遺伝子改変を最小限に抑えるための貴重なリソースを提供する [crisp_bio 2023-09-11]。
AIは、DNAを標的とするCRISPR (例えば、Cas9)と同様に、RNAを標的とするCRISPRシステム (例えば、Cas13) にも展開されている。 Neville Sanjanaの研究チームは、AIとRNA標的CRISPRスクリーニングを組み合わせ、深層学習モデル、gRNA設計による遺伝子発現の標的化阻害 (TIGER) を開発した。研究者らは、様々なヒト細胞株で必須遺伝子を標的とする200,000のgRNAsの活性をテストし、大規模なCas13dデータセットを作成した後、上記データを用いてTIGERをトレーニングし、Cas13d gRNAの標的化および標的外活性の包括的評価を行った。TIGERを活用して、著者らは次世代RNA標的療法の開発を進めた [crisp_bio 2023-07-06]。
一方、塩基編集の結果を予測するために、BE-DICT [crisp_bio 2021-08-28] 、DeepBaseEditor [crisp_bio 2020-07-12] 、CGBE-SMART [Nat Commun, 2021-8-12] 、CAELM [Nat Commun, 2022-11-30] など、さまざまな機械学習モデルが開発されている。
例えば、チューリッヒ大学の研究者らはまず、個々のDNA塩基編集システムにおける異なるsgRNAの編集効率を評価するために、ハイスループットDNA塩基編集sgRNAライブラリーを設計した。その後、sgRNAライブラリーの実験データを要約し、機械学習を使用して、各sgRNAの編集効率を予測できるアテンションベースの深層学習アルゴリズムBE-DICTを確立した。Songらは、ハイスループット法を使用して、13,504および14,157の標的配列に対するABEおよびCBEの編集効率を評価し、深層学習アルゴリズムを使用して良好な性能を有するBEモデルを開発した [DeepBaseEditor]。Yuanらは、特定の配列コンテクストを持つ標的部位におけるCからGへの編集効率を正確に予測するディープラーニングモデル、CGBE-SMARTを開発した。Liらは、高スループットin situ遺伝子編集のための自動化プラットフォームを開拓し、その後、膨大なin situ遺伝子編集データをクロマチンアクセシビリティと文脈化された配列と組み合わせて使用し、CBEの性能を予測し、in situ塩基編集の結果を決定するためのクロマチンアクセシビリティ有効化学習モデルCAELMを開発した。
3.3.2. AI assists genome editing design
AIはまた、特定のsgRNAの設計を支援するためにも利用されている。
特に、David R. Liuのチームが開発した機械学習ベースのsgRNA設計ツールBE-Hiveは、哺乳類細胞株における11種類のCBEとABEの実験結果に従って、編集効率と遺伝子型を正確に予測している [crisp_bio 2020-06-13]。
David R. Liuらと並行して、ZhangらはAIを利用してCRISPR gRNAの多次元的な性能を予測し、sgRNAの特異性と安定性をさらに向上させた [Cell Discov, 2023-05-16]。2つのヒト細胞株におけるターゲット編集効率、オフターゲット編集特異性、92万個のgRNAのDSB修復プロファイルを包括的に解析した。この広範なデータセットにより、gRNA活性を予測するAIdit_ON、オフターゲット活性を予測するAIdit_OFF、SpCas9によるDSB修復プロファイルを予測するAIdit_DSBなど、対応する深層学習モデルの開発が容易になった。さらに、高性能モデルを組み込んだ一般にアクセス可能なウェブサイト (https://crispr-aidit.com/)を公開した。ここで研究者は遺伝子名、配列断片、FASTAファイルを入力し、gRNAの多次元予測データを得ることができ、実験に適したgRNAをより正確に選択することができる。
特に、David R. Liuのチームが開発した機械学習ベースのsgRNA設計ツールBE-Hiveは、哺乳類細胞株における11種類のCBEとABEの実験結果に従って、編集効率と遺伝子型を正確に予測している [crisp_bio 2020-06-13]。
David R. Liuらと並行して、ZhangらはAIを利用してCRISPR gRNAの多次元的な性能を予測し、sgRNAの特異性と安定性をさらに向上させた [Cell Discov, 2023-05-16]。2つのヒト細胞株におけるターゲット編集効率、オフターゲット編集特異性、92万個のgRNAのDSB修復プロファイルを包括的に解析した。この広範なデータセットにより、gRNA活性を予測するAIdit_ON、オフターゲット活性を予測するAIdit_OFF、SpCas9によるDSB修復プロファイルを予測するAIdit_DSBなど、対応する深層学習モデルの開発が容易になった。さらに、高性能モデルを組み込んだ一般にアクセス可能なウェブサイト (https://crispr-aidit.com/)を公開した。ここで研究者は遺伝子名、配列断片、FASTAファイルを入力し、gRNAの多次元予測データを得ることができ、実験に適したgRNAをより正確に選択することができる。
4. Challenges and prospects
コメント