論文の概要: CFM-GP: Unified Conditional Flow Matching to Learn Gene Perturbation Across Cell Types
- arxiv url: http://arxiv.org/abs/2508.08312v1
- Date: Sat, 09 Aug 2025 00:00:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.163449
- Title: CFM-GP: Unified Conditional Flow Matching to Learn Gene Perturbation Across Cell Types
- Title(参考訳): CFM-GP: 細胞間の遺伝子摂動を学習するための統一条件付きフローマッチング
- Authors: Abrar Rahman Abir, Sajib Acharjee Dip, Liqing Zhang,
- Abstract要約: 細胞型非依存的遺伝子摂動予測法であるCFM-GPを提案する。
CFM-GPは、摂動遺伝子と摂動遺伝子発現の連続的、時間依存的な変換を学習する。
SARS-CoV-2感染, IFN-β刺激PBMCs, グリオ芽腫パノビノスタット, IFN-β刺激下でのループス, およびStatefate前駆者運命マッピングの5つのデータセットについて検討した。
- 参考スコア(独自算出の注目度): 9.04025604404011
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding gene perturbation effects across diverse cellular contexts is a central challenge in functional genomics, with important implications for therapeutic discovery and precision medicine. Single-cell technologies enable high-resolution measurement of transcriptional responses, but collecting such data is costly and time-consuming, especially when repeated for each cell type. Existing computational methods often require separate models per cell type, limiting scalability and generalization. We present CFM-GP, a method for cell type-agnostic gene perturbation prediction. CFM-GP learns a continuous, time-dependent transformation between unperturbed and perturbed gene expression distributions, conditioned on cell type, allowing a single model to predict across all cell types. Unlike prior approaches that use discrete modeling, CFM-GP employs a flow matching objective to capture perturbation dynamics in a scalable manner. We evaluate on five datasets: SARS-CoV-2 infection, IFN-beta stimulated PBMCs, glioblastoma treated with Panobinostat, lupus under IFN-beta stimulation, and Statefate progenitor fate mapping. CFM-GP consistently outperforms state-of-the-art baselines in R-squared and Spearman correlation, and pathway enrichment analysis confirms recovery of key biological pathways. These results demonstrate the robustness and biological fidelity of CFM-GP as a scalable solution for cross-cell type gene perturbation prediction.
- Abstract(参考訳): 多様な細胞コンテキストにおける遺伝子の摂動効果を理解することは、機能ゲノム学における中心的な課題であり、治療的発見と精密医療に重要な意味を持つ。
シングルセル技術は、高分解能な転写応答の測定を可能にするが、このようなデータの収集にはコストがかかり、時間を要する。
既存の計算手法では、しばしばセルタイプごとに別々のモデルが必要であり、スケーラビリティと一般化を制限している。
細胞型非依存的遺伝子摂動予測法であるCFM-GPを提案する。
CFM-GPは、非摂動型と摂動型の遺伝子発現分布の連続的、時間依存的な変換を、細胞タイプで条件付けし、単一のモデルで全ての細胞タイプを予測できるようにする。
離散モデリングを用いた従来のアプローチとは異なり、CFM-GPは流れマッチングの目的を用いて摂動力学をスケーラブルに捉えている。
我々は,SARS-CoV-2感染,IFN-β刺激PBMC,パノビノスタットによるグリオ芽腫,IFN-β刺激によるループス,Statefate前駆者運命マッピングの5つのデータセットについて検討した。
CFM-GPはR-squaredとSpearmanの相関において最先端のベースラインを一貫して上回り、経路富化分析は重要な生物学的経路の回復を裏付ける。
これらの結果から, CFM-GPの強靭性と生物学的忠実性は, クロスセル型遺伝子摂動予測のためのスケーラブルな解法であることが示された。
関連論文リスト
- Interpretable Graph Kolmogorov-Arnold Networks for Multi-Cancer Classification and Biomarker Identification using Multi-Omics Data [36.92842246372894]
Multi-Omics Graph Kolmogorov-Arnold Network (MOGKAN)は、メッセンジャーRNA、マイクロRNA配列、DNAメチル化サンプルを利用するディープラーニングフレームワークである。
グラフに基づく深層学習とマルチオミクスデータを統合することにより,提案手法は頑健な予測性能と解釈可能性を示す。
論文 参考訳(メタデータ) (2025-03-29T02:14:05Z) - A scalable gene network model of regulatory dynamics in single cells [88.48246132084441]
本稿では,遺伝子ネットワーク構造を結合微分方程式に組み込んで,遺伝子制御関数をモデル化する機能的学習可能モデルFLeCSを提案する。
FLeCS は (pseudo) 時系列の単一セルデータから, セルの動態を正確に推定する。
論文 参考訳(メタデータ) (2025-03-25T19:19:21Z) - scGSDR: Harnessing Gene Semantics for Single-Cell Pharmacological Profiling [5.831554646284266]
scGSDRは、細胞状態と遺伝子シグナル伝達経路の知識に基づく2つの計算パイプラインを統合するモデルである。
scGSDRは、遺伝子セマンティクスを組み込んで予測性能を高め、解釈可能性モジュールを使用する。
モデルはシングルドラッグの予測からドラッグの組み合わせを含むシナリオまで拡張された。
論文 参考訳(メタデータ) (2025-02-02T15:43:20Z) - Cell-ontology guided transcriptome foundation model [18.51941953027685]
オープンバイオロジー・バイオメディカルオントロジーファウンデーションの細胞オントロジーグラフにマッピングされた細胞型ラベルを利用して,CellxGeneデータベースから2200万の細胞上でscCelloを事前訓練した。
我々のTFMは、生物学的に重要なタスクにおいて、既存のTFMよりも競合的な一般化と伝達性性能を示す。
論文 参考訳(メタデータ) (2024-08-22T13:15:49Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - Path-GPTOmic: A Balanced Multi-modal Learning Framework for Survival Outcome Prediction [14.204637932937082]
本稿では,癌生存率予測のためのマルチモーダルパスGPTOmicフレームワークを提案する。
基礎モデルである scGPT の埋め込み空間は,最初は単一セルRNA-seq で訓練された。
生存予測のためのCox部分的可能性損失に対応する勾配変調機構を提案する。
論文 参考訳(メタデータ) (2024-03-18T00:02:48Z) - Mixed Models with Multiple Instance Learning [51.440557223100164]
一般化線形混合モデル(GLMM)とMultiple Instance Learning(MIL)を統合するフレームワークであるMixMILを紹介する。
実験結果から,MixMILは単一セルデータセットにおいて既存のMILモデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T16:42:42Z) - CausalBench: A Large-scale Benchmark for Network Inference from
Single-cell Perturbation Data [61.088705993848606]
本稿では,実世界の介入データに対する因果推論手法を評価するベンチマークスイートCausalBenchを紹介する。
CaulBenchには、新しい分散ベースの介入メトリクスを含む、生物学的に動機付けられたパフォーマンスメトリクスが含まれている。
論文 参考訳(メタデータ) (2022-10-31T13:04:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。