- ガイドRNAの設計が欧州系に偏ったゲノムデータをベースとする参照ゲノムデータベースに準拠してる故に
抗癌剤をはじめとする創薬パイプラインにおける標的の優先順位付けに遺伝的祖先 (genetic ancestry)が影響することは認識されていたが、適切な規模の前臨床データが無いために、体系的な分析がされてこなかった。また、癌必須遺伝子の探索は主として体細胞変異を対象としており、生殖細胞系列に見られる変異を対象した例はほとんど無かった。
研究チームは、ヒト細胞株モデルを用いた611件のゲノムスケールのCRISPR/Cas9生存率実験から得られたデータを分析し、家系によって左右される必須遺伝子を発見した。驚くべきことに、家系に依存する癌細胞必須遺伝子のほとんどは、生殖細胞系列変異に関連するアーチファクトに由来していた。今回の解析では、ガイドRNA (sgRNA) [*]の1.2-2.5%において、sgRNAの標的配列に見られる生殖細胞系列の変異がCRISPR/Cas9ヌクレアーゼによる切断を減少させ、ひいては、癌必須遺伝子を見逃す結果 (偽陰性)になることを発見した。
[*] ゲノムスケールsgRNAライブラリー由来:Avana, Calabrese, Dolcetto, GeCKOv2, MinLibCas9, TKOv3, and HSANGERV
ゲノムスケールのライブラリーに含まれるsgRNAsの89%に配列が完全に一致しない遺伝子が、少なくとも一つの細胞株に見られた。また、このミスマッチ、ひいては、偽陰性のアーチファクトが、アフリカ系の個人に由来する細胞モデルにおいてより多く発生していた。これは、sgRNAの設計のベースとされてきた参照ゲノムが、主にヨーロッパ人の祖先から採取されたサンプルに由来し、ヒトの遺伝的多様性全体をカバーしていなことに由来する隠れたバイアス, 祖先バイアス (ancestry bias) 、を内包していたからである。
個々の研究プロジェクトにおいて、多様な人類集団の膨大なゲノムデータ (pan genome) 全てをダウンロードすることは現実には困難であることから、研究チームは、Genome Aggregation Database (gnomAD) のデータをベースにしたWebサービス"Ancestry Garden" (https://ancestrygarden.org/#/: スクリーンキャプチャを右図に引用)を構築・公開した。
[注] 今回の分析の対象とした癌依存性遺伝子マップであるDepMapのデータの場合は、1%が祖先バイアスの影響を受けたが、bioRxiv 投稿後に、機能しなかったすべてのsgRNAをDepMapから削除し、影響を受けた遺伝子について依存性がないと誤った情報を提供せずに、「結論を出すのに十分なデータがない」ことを示すように変更した。
[出典]
- 論文 "Germline variation contributes to false negatives in CRISPR-based experiments with varying burden across ancestries" Misek SA [..] Beroukhim R, Boehm JS. (bioRxiv 2022-11-19) Nat Commun. 2024-06-07. https://doi.org/10.1038/s41467-024-48957-z [所属] Broad Institute of MIT and Harvard, Dana-Farber Cancer Institute, Koch Institute (MIT).
- ニュース "Some CRISPR screens may be missing cancer drug targets" DiCorato A. Broad Institute 2024-06-14. https://www.broadinstitute.org/news/some-crispr-screens-may-be-missing-cancer-drug-targets
癌の精密治療 (個別化医療)を実現するには、社会環境要因の変動を考慮する必要があるが、それに加えて、人類集団ひては各個人に特有な遺伝的変異にも考慮する必要があることを、米国の研究チームが明らかにした。
抗癌剤をはじめとする創薬パイプラインにおける標的の優先順位付けに遺伝的祖先 (genetic ancestry)が影響することは認識されていたが、適切な規模の前臨床データが無いために、体系的な分析がされてこなかった。また、癌必須遺伝子の探索は主として体細胞変異を対象としており、生殖細胞系列に見られる変異を対象した例はほとんど無かった。
研究チームは、ヒト細胞株モデルを用いた611件のゲノムスケールのCRISPR/Cas9生存率実験から得られたデータを分析し、家系によって左右される必須遺伝子を発見した。驚くべきことに、家系に依存する癌細胞必須遺伝子のほとんどは、生殖細胞系列変異に関連するアーチファクトに由来していた。今回の解析では、ガイドRNA (sgRNA) [*]の1.2-2.5%において、sgRNAの標的配列に見られる生殖細胞系列の変異がCRISPR/Cas9ヌクレアーゼによる切断を減少させ、ひいては、癌必須遺伝子を見逃す結果 (偽陰性)になることを発見した。
[*] ゲノムスケールsgRNAライブラリー由来:Avana, Calabrese, Dolcetto, GeCKOv2, MinLibCas9, TKOv3, and HSANGERV
ゲノムスケールのライブラリーに含まれるsgRNAsの89%に配列が完全に一致しない遺伝子が、少なくとも一つの細胞株に見られた。また、このミスマッチ、ひいては、偽陰性のアーチファクトが、アフリカ系の個人に由来する細胞モデルにおいてより多く発生していた。これは、sgRNAの設計のベースとされてきた参照ゲノムが、主にヨーロッパ人の祖先から採取されたサンプルに由来し、ヒトの遺伝的多様性全体をカバーしていなことに由来する隠れたバイアス, 祖先バイアス (ancestry bias) 、を内包していたからである。

個々の研究プロジェクトにおいて、多様な人類集団の膨大なゲノムデータ (pan genome) 全てをダウンロードすることは現実には困難であることから、研究チームは、Genome Aggregation Database (gnomAD) のデータをベースにしたWebサービス"Ancestry Garden" (https://ancestrygarden.org/#/: スクリーンキャプチャを右図に引用)を構築・公開した。
[注] 今回の分析の対象とした癌依存性遺伝子マップであるDepMapのデータの場合は、1%が祖先バイアスの影響を受けたが、bioRxiv 投稿後に、機能しなかったすべてのsgRNAをDepMapから削除し、影響を受けた遺伝子について依存性がないと誤った情報を提供せずに、「結論を出すのに十分なデータがない」ことを示すように変更した。
コメント