論文の概要: scDFM: Distributional Flow Matching Model for Robust Single-Cell Perturbation Prediction
- arxiv url: http://arxiv.org/abs/2602.07103v1
- Date: Fri, 06 Feb 2026 17:00:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.450573
- Title: scDFM: Distributional Flow Matching Model for Robust Single-Cell Perturbation Prediction
- Title(参考訳): scDFM:ロバスト単セル摂動予測のための分布流マッチングモデル
- Authors: Chenglei Yu, Chuanrui Wang, Bangyan Liao, Tailin Wu,
- Abstract要約: 条件付きフローマッチングに基づく生成フレームワークである scDFM を提案する。
scDFMは、細胞レベルでの通信以上の個体群を混乱させ、制御する。
- 参考スコア(独自算出の注目度): 12.48933770510505
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A central goal in systems biology and drug discovery is to predict the transcriptional response of cells to perturbations. This task is challenging due to the noisy and sparse nature of single-cell measurements, as well as the fact that perturbations often induce population-level shifts rather than changes in individual cells. Existing deep learning methods typically assume cell-level correspondences, limiting their ability to capture such global effects. We present scDFM, a generative framework based on conditional flow matching that models the full distribution of perturbed cells conditioned on control states. By incorporating a maximum mean discrepancy (MMD) objective, our method aligns perturbed and control populations beyond cell-level correspondences. To further improve robustness to sparsity and noise, we introduce the Perturbation-Aware Differential Transformer (PAD-Transformer), a backbone architecture that leverages gene interaction graphs and differential attention to capture context-specific expression changes. Across multiple genetic and drug perturbation benchmarks, scDFM consistently outperforms prior methods, demonstrating strong generalization in both unseen and combinatorial settings. In the combinatorial setting, it reduces mean squared error by 19.6% relative to the strongest baseline. These results highlight the importance of distribution-level generative modeling for robust in silico perturbation prediction. The code is available at https://github.com/AI4Science-WestlakeU/scDFM
- Abstract(参考訳): システム生物学と薬物発見の中心的な目標は、摂動に対する細胞の転写反応を予測することである。
この課題は、単一細胞測定のノイズとスパースの性質、および摂動が個々の細胞の変化よりも人口レベルの変化を引き起こすことによる。
既存のディープラーニング手法は、通常、細胞レベルの対応を仮定し、そのようなグローバルな効果を捉える能力を制限する。
制御状態に応じた摂動細胞の完全な分布をモデル化した条件流マッチングに基づく生成フレームワークである scDFM を提案する。
最大平均不一致(MMD)目標を組み込むことで,細胞レベルでの対応を超越した摂動・制御を行う。
空間性やノイズに対するロバスト性を改善するために,遺伝子相互作用グラフと差分アテンションを利用した文脈特異的な表現変化をキャプチャするバックボーンアーキテクチャであるPerturbation-Aware Differential Transformer (PAD-Transformer)を導入する。
複数の遺伝子と薬物の摂動ベンチマークにおいて、scDFMは従来手法よりも一貫して優れており、目に見えない設定と組み合わせの設定の両方において強力な一般化を示している。
組み合わせ設定では、最強のベースラインに対して平均2乗誤差を19.6%削減する。
これらの結果は,シリコ摂動予測におけるロバストな分布レベルの生成モデルの重要性を強調した。
コードはhttps://github.com/AI4Science-WestlakeU/scDFMで公開されている。
関連論文リスト
- Robust Machine Learning for Regulatory Sequence Modeling under Biological and Technical Distribution Shifts [0.3948325938742681]
性能劣化、校正失敗、不確実性に基づく信頼性を定量化するためのロバストネスフレームワークを導入する。
シミュレーションでは、セル型特異的プログラム、摂動、GCバイアス、深さ変化、バッチ効果、ヘテロscedastic noiseによってモチーフ駆動の制御出力が生成される。
モデルは精度は保たれるが、高い誤差、激しいばらつきの誤校正、モチーフ効果の反転とノイズによるカバー崩壊が支配的な体制である。
論文 参考訳(メタデータ) (2026-01-21T13:15:27Z) - Latent Causal Diffusions for Single-Cell Perturbation Modeling [83.47931153555321]
測定ノイズ下で観察された定常拡散過程として単細胞遺伝子発現をフレーム化する生成モデルを提案する。
LCDはシングルセルRNAシークエンシングスクリーンにおいて、目に見えない摂動の組み合わせの分布変化を予測するために確立されたアプローチより優れていた。
我々は、摂動応答(CLIPR)を介して因果線形化と呼ばれるアプローチを開発し、全ての遺伝子間の直接的な因果効果を近似する。
論文 参考訳(メタデータ) (2026-01-20T16:15:38Z) - Departures: Distributional Transport for Single-Cell Perturbation Prediction with Neural Schrödinger Bridges [51.83259180910313]
遺伝子機能解析における大きなボトルネックは、単細胞データの未成熟の性質である。
我々は、SB(Schrdinger Bridge)を近似して、単セル摂動データに対処する。
本モデルは,異種単一セル応答を効果的に捉え,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-11-17T08:27:13Z) - Scalable Single-Cell Gene Expression Generation with Latent Diffusion Models [11.343106383645441]
単一細胞遺伝子発現データに対してスケーラブルな潜伏拡散モデルを導入し、これを scLDM と呼ぶ。
観測および摂動単細胞データおよびセルレベルの分類などの下流タスクにおいて,様々な実験において,その優れた性能を示す。
論文 参考訳(メタデータ) (2025-11-04T20:44:12Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - Large-Scale Targeted Cause Discovery via Learning from Simulated Data [66.51307552703685]
本稿では,観測結果から対象変数の因果変数を推定する機械学習手法を提案する。
我々は、シミュレートされたデータに基づいて教師あり学習を用いてニューラルネットワークを訓練し、因果関係を推定する。
大規模遺伝子制御ネットワークにおける因果関係の同定に優れた性能を示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-08-29T02:21:11Z) - sc-OTGM: Single-Cell Perturbation Modeling by Solving Optimal Mass Transport on the Manifold of Gaussian Mixtures [0.9674145073701153]
sc-OTGMは、scRNAseqデータが生成される誘導バイアスに基づく教師なしモデルである。
sc-OTGMは細胞状態の分類、異なる遺伝子発現の解析、標的同定のための遺伝子ランキングに有効である。
また、下流遺伝子制御に対する単一遺伝子の摂動の影響を予測し、特定の細胞状態に条件付けられた合成scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-05-06T06:46:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。