ゲノム編集は、単一な所定の産物をもたらすよりも、しばしば複雑な対立遺伝子が混合した産物をもたらし、ひいては、ゲノム編集で利用される多様な手法やシーケンスプラットフォーム、また、多重化の戦略にわたる異質な編集の結果を解釈することは依然として大きな課題になっています。この課題の解決に向けて、IUF-Leibniz Research Institute for Environmental Medicineにおいて二つの研究室を率いているAndrea Rossi博士が責任著者となっているTrends in Biotechnology 誌刊行論文は、バイオインフォマティクスで用いられる配列整列手段の一つである制約付きセミグローバルアライメント*(Constrained Semi-global Alignment)を介して、ゲノム編集結果をジェノタイピングするWebブラウザー上で稼働するブラウザネイティブなフレームワーク、CleanFinder、を紹介しています。
[*] 配列全体を端から端まで比較するグローバルアラインメントに対して、一方の配列(通常、長い方の配列)の両端で発生する不一致部分にペナルティーを課さないセミグローバル(エンドフリー)アライメントであり、それに加えて、アライメント経路の探索範囲を制約する手法
[詳細]
背景
近年、CRISPRシステムをベースとするCas9やCas12aといったヌクレアーゼによる編集、塩基エディター(BE)による編集、プライムエディター(PE)による編集、あるいはRNAフリーのDddA由来シトシン塩基エディター(DdCBE)などのCRISPRフリーシステムが、プログラム可能な遺伝子操作の範囲を拡大してきました。
しかし、挿入と欠失(インデル)、染色体の複雑な再編成、オフターゲット効果などの編集イベントの検出と分類には、多くの場合、専門的な計算の専門知識と高度なバイオインフォマティクスツールへのアクセスが必要です。これは多くの研究室、特にゲノム編集手法を日常的に使用していない研究室にとってボトルネックとなっています。
CRISPR/Cas編集データの解析に用いられる既存のツールは、通常、ローカル環境へのインストールとコマンドライン実行を必要とし、多くの場合、Python環境、Dockerなどのコンテナ化ソリューション、またはNextflowなどのワークフローマネージャーに統合されています。これらの手法は強力ではありますが、計算科学の専門知識を持たないユーザーにとっては実用上の障壁となり、迅速な探索的解析を複雑化させる可能性があります。
確かにこれらのツールの一部はWebベースで実装されており、アクセス性は向上していますが、処理できるサンプル数が制限されていたり、単一サンプル解析のみをサポートしていたりするなど、スループットに制約がある場合が多くあります。さらに、Webベースのツールは、多くの場合、ショートリードのIlluminaジェノタイピングワークフローに基づいて設計されており、Oxford Nanopore Technologies(ONT)などのロングリードプラットフォーム特有のエラープロファイルやリード長特性には部分的にしか対応していません。
確かにこれらのツールの一部はWebベースで実装されており、アクセス性は向上していますが、処理できるサンプル数が制限されていたり、単一サンプル解析のみをサポートしていたりするなど、スループットに制約がある場合が多くあります。さらに、Webベースのツールは、多くの場合、ショートリードのIlluminaジェノタイピングワークフローに基づいて設計されており、Oxford Nanopore Technologies(ONT)などのロングリードプラットフォーム特有のエラープロファイルやリード長特性には部分的にしか対応していません。
成果
研究チームはゲノム編集結果の分析上および実用上の制約に対処するため、ゲノム編集結果の高解像度ジェノタイピングを可能にするモジュール型フレームワークとして CleanFinder を開発しました。
制約付きセミグローバルアライメント戦略に基づいて構築されたこのプラットフォームは、Cas9、Cas12、BE、PEなど、多様な編集手法にわたるコンテキスト認識型分類をサポートし、IlluminaおよびONTのシーケンス技術に対応しています。CleanFinderは、Rational Indel Meta-Analysis(RIMA)[#1] およびREPAIRome解析 [#2] によるDNA修復経路シグネチャの推論のための専用分析モジュールと、ヘテロ接合型一塩基多型(SNP)に基づくアレル認識型分類を統合し、アレルの脱落(allelic dropout)を検出します。さらに、専用のPEモードでは、野生型(WT)と意図した編集のスコアリングを競合的に実行し、複数の遺伝子座および細胞コンテキストにわたる複雑な挿入、欠失、置換イベントを解決します。[グラフィカルアブストラクトから引用したCleanFinderの概要とFigure 1から引用したそのモジュール構成を紹介している以下の2つの図を参照]
CleanFinderは、探索的ワークフローと大規模ワークフローの両方に対応するため、Webブラウザ上で直接動作するブラウザネイティブのWebインターフェースと、フル機能のコマンドラインインターフェース(CLI)の双方で、利用できます。
また、標準的な決定論的パイプラインに加え、標準的な編集実験を迅速に解析するためのハイスループットなヒューリスティックなターボモードも実装されています。
また、標準的な決定論的パイプラインに加え、標準的な編集実験を迅速に解析するためのハイスループットなヒューリスティックなターボモードも実装されています。
CLI版は、コンテキスト認識アライメント、編集分類、RIMA/REPAIRomeプロファイリング、アレル認識ドロップアウト検出など、Webアプリケーションの完全な解析機能を再現しつつ、ブラウザのメモリ制限を解消しています。これにより、大規模データセットのスケーラブルなバッチ処理と、カスタムバイオインフォマティクスパイプラインへのシームレスな統合が可能になります。
統合されたゲノムビューアは、遺伝子構造、コーディング領域、翻訳されたタンパク質配列、およびオプションのgRNA配置を遺伝子座レベルで可視化し、ゲノムおよび機能的枠組みの中で編集結果を文脈的に解釈することを容易にします。
CleanFinderの拡張性と実用性は、HEK293T細胞を用いた1849種類の化合物からなるハイスループット低分子スクリーニングにおいて実証され、様々な実験条件下における結果の体系的な比較が可能なことが、確認されました
CleanFinderは、プラットフォーム、遺伝子座、実験デザインを横断したゲノム編集結果の体系的な比較のための、柔軟かつ拡張性の高い分析フレームワークを提供します。[右図はブラウザネイティブWebインターフェース https://cleanfinder.org のトップ画面のキャプチャー][#] 引用したcrisp_bio記事
- crisp_bio 2018-07-24 奥が深いCas9によるDSBからのdsDNAの修復結果と修復過程を探る (2件) [第2項] Cas9標的部位に発生する非ランダムな変異を読み解く.
- crisp_bio 2025-10-06 Human REPAIRome: 18,000を超える遺伝子のDNA二本鎖切断 (DSB) からの修復パターンを網羅し, ウエッブサイトから公開.
[出典] "CleanFinder: a scalable framework for comprehensive genome editing analysis" Haribaskar Ramachandran (1) [..] Andrea Rossi (1,2). Trends Biotechnol. 2026-05-22. https://doi.org/10.1016/j.tibtech.2026.04.024
- Genome Engineering and Model Development Laboratory. https://iuf-duesseldorf.de/en/research/core-units/gemd/. , IUF-Leibniz Research Institute for Environmental Medicine, Düsseldorf, Germany
- Environmental Adaptation and Cellular Resilience Laboratory https://iuf-duesseldorf.de/en/research/working-groups/wg-rossi/ , IUF-Leibniz Research Institute for Environmental Medicine, Düsseldorf, Germany
- Department of General Pediatrics, Neonatology and Pediatric Cardiology, Medical Faculty, University Hospital Düsseldorf, Heinrich Heine University, Düsseldorf 40225, Germany
- Genome Engineering and Measurement Laboratory (GEML), ETH Zürich, Zürich 8093, Switzerland
- Environmentally-Induced Skin Aging Group, IUF-Leibniz Research Institute for Environmental Medicine, Düsseldorf, Germany
- Laboratory of Chromatin and Gene Regulation During Development, University Paris Cite, UMR1163 INSERM, Imagine Institute, Paris, France
- Biostatistical Methods for Environmental Medicine Group, IUF-Leibniz Research Institute for Environmental Medicine, Düsseldorf, Germany
- Department of Statistics, TU Dortmund University, Dortmund, Germany


コメント