- Perturbation Catalogueは、EMBL-EBIがウェルカム・サンガー研究所とヒューマン・テクノポール(Human Technopole)が共同で進めているOpen Targetsプロジェクトの成果である。
- 遺伝子スクリーニング技術の進歩に伴い、生成されるデータセットの数は急速に増加しているが、これらのデータセットは異なる形式やリポジトリに分散している。Perturbation Catalogueは、さまざまなタイプの遺伝子摂動データの単一のWebサイトでの統合検索を可能にする。 [Perturbaeion Catalogueのホームページと概要説明ページを順次以下に引用]
- Perturbation Catalogueは、専門家によって品質管理され(curated)標準化されたデータへのアクセスを提供することで、創薬、データの再利用を改善し、機械学習モデル構築を支援する。
- Perturbation Catalogueを介して、科学者は、健康な状態と罹患している状態における遺伝子の振る舞いを理解することができる。
- Perturbation Catalogueのコードとドキュメントは、GitHubリポジトリでアクセスできる。
現在公開中のベータ版には、以下のキュレーションデータが含まれている:
- MaveDB (Multiplexed Assays of Variant Effect DB):ディープミューテーションスキャニング (DMS) または超並列レポーターアッセイ (MPRA) 実験によって生成されたデータ
- DepMap:ゲノムワイドCRISPRスクリーニングデータ
- scPerturbおよびPerturBase:発現レベルの摂動データ
このプラットフォームは、Google BigQueryとGoogle Cloudインフラストラクチャによってサポートされており、Python用のデータ検証ライブラリであるPydanticを使用することで、データの一貫性とメタデータの標準化が確保されている。
なお、Perturbation Catalogueは、Ensembl、UniProt、PDBe、ChEMBLなど、EMBL-EBIの他のリソースと統合される予定である。
なお、Perturbation Catalogueは、Ensembl、UniProt、PDBe、ChEMBLなど、EMBL-EBIの他のリソースと統合される予定である。
[出典] News "New platform integrates gene perturbation data" Hatch V. All EMBL-EBI. 2025-07-23. https://www.ebi.ac.uk/about/news/updates-from-data-resources/new-platform-integrates-gene-perturbation-data/ [著者所属] EBI


コメント