論文の概要: On the Recoverability of Causal Relations from Bulk Gene Expression Data
- arxiv url: http://arxiv.org/abs/2606.00568v2
- Date: Mon, 08 Jun 2026 08:23:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:04.678802
- Title: On the Recoverability of Causal Relations from Bulk Gene Expression Data
- Title(参考訳): バルク遺伝子発現データからの因果関係の復元可能性について
- Authors: Gongxu Luo, Boyang Sun, Kun Zhang,
- Abstract要約: 増大する計算手法は、バルク表現データから遺伝子間の因果関係を回復しようとするものである。
集約バルク遺伝子発現データから因果関係が回復可能かどうか, あるいはどの条件下でも不明である。
- 参考スコア(独自算出の注目度): 14.304626225459932
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bulk gene expression profiling, which aggregates pooled RNA across cells within a biological sample, remains important in the single-cell era because it is typically less noisy, more sensitive, and more cost-effective than single-cell assays. Accordingly, a growing body of computational methods seeks to recover causal relations among genes from bulk expression data. However, aggregation is a lossy, non-invertible coarsening of the underlying cellular system, and it remains unclear whether and under what conditions causal relations are recoverable from aggregated bulk gene expression data. To answer this, we formalize recoverability under aggregation through two notions of consistency: functional-form consistency and conditional-independence consistency. We then derive necessary and sufficient conditions for recoverability, showing that these properties are preserved only under linear aggregations (e.g., sum/mean) coupled with affine structural equations. To assess the practical plausibility of these conditions, analyses of four bulk and four single-cell gene expression datasets further reveal that the estimated pairwise regulatory functions among genes deviate from linearity in both data types, providing limited empirical support for the linearity assumptions required for recoverability. Together, these results caution against recovering causal relations from aggregated bulk expression data without strong additional assumptions.
- Abstract(参考訳): バルク遺伝子発現プロファイリング(英語版)は、生物学的サンプル内の細胞内にプールされたRNAを集約するが、通常は単細胞アッセイよりもノイズが少なく、感度が高く、費用対効果が高いため、単細胞時代において重要である。
そこで, バルク表現データから, 遺伝子間の因果関係を復元する計算手法が増加している。
しかし,アグリゲーションは細胞系を損なう非可逆的粗大化であり,バルク遺伝子発現データからどの条件下で因果関係が回復可能かは定かではない。
これに対応するために,関数形式整合性と条件独立整合性という,2つの整合性の概念を通したアグリゲーション下での回復可能性の定式化を行う。
これらの性質はアフィン構造方程式と結合した線形凝集(eg, sum/mean)の下でのみ保存されることを示す。
これらの条件の実用的妥当性を評価するため、4つのバルクおよび4つの単細胞遺伝子発現データセットの解析により、両データ型の線形性から逸脱する遺伝子間の推定一対制御関数が明らかにされ、リカバリ可能性に必要な線形性仮定に対する限定的な実証的支援が提供される。
これらの結果は,強い仮定を伴わずに,集約されたバルク表現データから因果関係の回復を警告するものである。
関連論文リスト
- Bias Inheritance in Neural-Symbolic Discovery of Constitutive Closures Under Function-Class Mismatch [1.6249267147413524]
PDE構造を持つ非線形反応拡散系における閉包のデータの駆動的発見について検討する。
物理的制約下で数値的代理を学習し、これらの代理を制限可能な記号族に圧縮し、未知の初期条件で明示的な前方シミュレーションによってシンボル的クロージャを検証する3段階のニューラルネットワーク・シンボリック・フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-01T19:39:04Z) - Sample Complexity of Causal Identification with Temporal Heterogeneity [6.5822033630228916]
環境多様性の欠如に対して,時間構造が効果的に置き換えられることを示す。
この研究は、因果構造が特定可能かどうかから、実際に統計的に回復可能かどうかに焦点を移す。
論文 参考訳(メタデータ) (2026-02-06T17:44:00Z) - Departures: Distributional Transport for Single-Cell Perturbation Prediction with Neural Schrödinger Bridges [51.83259180910313]
遺伝子機能解析における大きなボトルネックは、単細胞データの未成熟の性質である。
我々は、SB(Schrdinger Bridge)を近似して、単セル摂動データに対処する。
本モデルは,異種単一セル応答を効果的に捉え,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-11-17T08:27:13Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - CausalGeD: Blending Causality and Diffusion for Spatial Gene Expression Generation [11.664880068737084]
本稿では,遺伝子間の因果関係を活用するために,拡散と自己回帰過程を組み合わせたCausalGeDを提案する。
10の組織データセットで、CausalGeDは最先端のベースラインを5~32%上回った。
論文 参考訳(メタデータ) (2025-02-11T18:26:22Z) - Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - CausalBench: A Large-scale Benchmark for Network Inference from
Single-cell Perturbation Data [61.088705993848606]
本稿では,実世界の介入データに対する因果推論手法を評価するベンチマークスイートCausalBenchを紹介する。
CaulBenchには、新しい分散ベースの介入メトリクスを含む、生物学的に動機付けられたパフォーマンスメトリクスが含まれている。
論文 参考訳(メタデータ) (2022-10-31T13:04:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。