2025-12-30 News & Views記事とResearch Highlights記事の引用を以下に追加:
2025-01-20 初稿
[注] GET (general expression transformer);基盤モデル (foundation model - generally using self-supervision at scale) that can be adapted (e.g., fine-tuned) to a wide range of downstream tasks)
- News & Views "AI learns from chromatin data to uncover gene interactions" Brożek A, Theodoris CV. Nature. 2025-01-08; DNA がパッケイジングされている領域と、調節因子に開かれている場所に関するデータでトレーニングされたAIモデルによって、遺伝子発現と、主要な遺伝子を制御する転写因子間の相互作用を予測することが可能になった。
- Research Highlight "A chromatin-based model for deciphering gene interactions" Li R. Nat Biotechnol. 2025-02-14;基礎モデル(foundation models)は、細胞型のアノテーションや摂動への応答予測といったタスクにおいて、多様な遺伝子発現プロファイルを活用してきた。しかし、クロマチンランドスケープがどのように転写を制御するかを示すモデルは存在していなかった。今回のNature誌刊行論文で、多様なヒト細胞型のクロマチンアクセシビリティデータを用いて学習した基礎モデルである汎用発現トランスフォーマー(GET)による特定の細胞における遺伝子活性予測が可能になったことが報告されている。
[注] GET (general expression transformer);基盤モデル (foundation model - generally using self-supervision at scale) that can be adapted (e.g., fine-tuned) to a wide range of downstream tasks)
転写制御は、制御配列とタンパク質間の複雑な相互作用を介して、全ての生物学的プロセスを方向付ける仕組みである。転写の計算モデルは、未知の細胞型や条件に正確に外挿するための汎化性(generalizability)に欠けている。この課題解決に向けて、コロンビア大学とカーネギーメロン大学を主とする研究チームが今回、GET(general expression transformer)を開発した [論文 Fig. 1 参照]。
- GETはクロマチンアクセシビリティデータ(scATAC-seqに由来)と塩基配列情報のみに依存し、遺伝子ペアの発現データを必要としない。
- GETは、213種類のヒト胎児および成体細胞における「制御文法」を明らかにするためにデザインされた、解釈可能な基盤モデルであり、未知の細胞型においても遺伝子発現の予測において実験レベルの精度を達成している。
- GETは基盤モデルとして、新しいシーケンシングプラットフォームやアッセイに顕著な適応性を示し、広範な細胞型や条件下での制御推論を可能にし、普遍的かつ細胞型特異的な転写因子相互作用ネットワークを明らかにする。
- 制御活性の予測、制御エレメントと制御因子の推論、転写因子間の物理的相互作用の同定における性能を評価し、レンチウイルスベースの超並列レポーターアッセイ(lentivirus-based massively parallel reporter assay: lentiMPRA)の読み出し予測において、現行のモデル [Avsec Ž et al., 2021]よりも優れていることが確認された。
- 胎児赤芽球では、これまでのモデルでは見逃されていた遠位(1 Mbp以上)の制御領域を同定し、B細胞では、白血病リスク素因となる生殖細胞突然変異の機能的意義を説明するリンパ球特異的転写因子-転写因子相互作用が同定された。
GETは転写の汎化可能で正確なモデルであり、GETを介してその全てが細胞型特異性を備えた遺伝子制御と転写因子相互作用のカタログが提供された。事前に計算された調節推論結果、前処理済みデータ、およびAlphaFold2による予測構造が、GET Web サイト (https://huggingface.co/spaces/get-foundation/GET) から公開されている。
[関連crisp_bio記事]
[関連crisp_bio記事]
- 2025-01-20 転写制御エレメントの超並列キャラクタリゼーション
[出典] "A foundation model of transcription across human cell types" Fu X [..] Xing EP, Rabadan R. (bioRxiv 2023-09-24) Nature. 2025-01-08. https://doi.org/10.1038/s41586-024-08391-z [著者所属] Columbia U (Program of Mathematical Genomics, Dept Biomedical Informatics, Institute for Cancer Genetics, Dept Dermatology, Dept Genetics and Developmen, Dept Pathology and Cell Biology), New York University Grossman School of Medicine (Institute for Systems Genetics), Carnegie Mellon U (Dept Machine Learning), Regeneron Genetics Center, Mohamed bin Zayed U Artificial Intelligence (UAE), Tsinghua U (Institute for AI Industry Research, Beijing Frontier Research Center for Biological Structure)
コメント