論文の概要: FoundCause: Causal Discovery with Latent Confounders from Observational Data
- arxiv url: http://arxiv.org/abs/2606.17516v1
- Date: Tue, 16 Jun 2026 04:50:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.274142
- Title: FoundCause: Causal Discovery with Latent Confounders from Observational Data
- Title(参考訳): FoundCause: 観測データから遅れた共同創設者による因果発見
- Authors: Patrick Blöbaum, Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan,
- Abstract要約: FoundCauseは、完全に合成データに基づいて訓練された、償却された因果発見モデルである。
個々のデータセットを超えて一般化される、転送可能な統計パターンをキャプチャする。
FoundCauseは15の現実世界のデータセットで11の古典的な非アモート化メソッドを上回ります。
- 参考スコア(独自算出の注目度): 16.98165241701198
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal discovery from observational data remains challenging due to the need to recover directed structure and latent confounding without interventions. We propose FoundCause, an amortized causal discovery model trained entirely on synthetic data that maps datasets directly to causal graphs in a single forward pass. By learning from large collections of simulated structural causal models, FoundCause captures transferable statistical patterns that generalize beyond individual datasets. The architecture incorporates several key inductive biases for causal discovery. It uses a permutation-invariant transformer encoder with alternating attention over samples and variables to jointly model cross-variable dependence and per-variable distributions. Pairwise statistical features derived from classical asymmetry measures are injected through statistics-conditioned attention, guiding the model toward known causal signals. A factorized decoder separates edge existence from direction, while a triangular refinement module enables reasoning over higher-order causal motifs such as chains and colliders. In addition, a dedicated confounder module based on learnable latent tokens explicitly models hidden common causes, and the model explicitly handles missing data via its masked input representation. To our knowledge, FoundCause is the first amortized causal discovery approach to explicitly model latent confounding. FoundCause outperforms 11 classical non-amortized methods (e.g., PC, GES, NOTEARS-style optimization) and 4 amortized causal discovery methods on 15 real-world datasets, achieving +9.6% improvement in $F_1$, +1.2% in AUROC, and an 18.9% reduction in structural Hamming distance relative to the strongest non-amortized methods, while performing inference in a single forward pass.
- Abstract(参考訳): 観測データからの因果発見は、指示された構造を復元し、介入なしに潜伏する必要性のため、依然として困難である。
我々は、データセットを単一の前方パスで因果グラフに直接マッピングする合成データに基づいて訓練された、償却因果発見モデルFoundCauseを提案する。
シミュレーションされた構造因果モデルの大規模なコレクションから学ぶことで、FoundCauseは個々のデータセットを超えて一般化される転送可能な統計パターンをキャプチャする。
このアーキテクチャには因果発見のための重要な帰納バイアスがいくつか含まれている。
置換不変なトランスフォーマーエンコーダを使用し、サンプルと変数を交互に注目することで、クロス変数依存とパー変数分布を共同でモデル化する。
古典的非対称性測度から導かれるペアワイズ統計特徴は、統計条件付き注意を通して注入され、モデルが既知の因果信号に導かれる。
分解デコーダは方向からエッジの存在を分離し、三角形の精製モジュールは鎖や衝突子のような高次因果モチーフの推論を可能にする。
さらに、学習可能な潜在トークンに基づく専用共同設立モジュールは、隠された共通の原因を明示的にモデル化し、モデルはマスクされた入力表現を通じて、行方不明データを明示的に処理する。
我々の知る限り、FoundCauseは潜伏する共起を明示的にモデル化する最初のアモートされた因果発見アプローチである。
FoundCauseは、11の古典的非アモルト化法(例えば、PC、GES、NOTEARSスタイルの最適化)と15の現実世界のデータセット上で4つのアモルト化因果発見法を上回り、AUROCの$F_1$、+1.2%の改善を+9.6%達成し、最強の非アモルト化法に対する構造ハミング距離を18.9%削減した。
関連論文リスト
- CALM: A Causal Analysis Language Model for Tabular Data in Complex Systems with Local Scores, Conditional Independence Tests, and Relation Attributes [15.298086464296235]
観測データからの因果発見は生物学のような科学分野に不可欠である。
制約ベースのアプローチやスコアベースのアプローチを含む既存の手法は、重大な制限に直面している。
本稿では,表データに特化して設計された新しい因果解析言語CALMを紹介する。
論文 参考訳(メタデータ) (2025-10-10T20:19:20Z) - Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Sample, estimate, aggregate: A recipe for causal discovery foundation models [28.116832159265964]
因果発見は、生物学的実験から機械的な洞察を明らかにする可能性がある。
因果グラフを予測するために,大規模合成データに基づいて学習した教師付きモデルを提案する。
我々のアプローチは、発見アルゴリズムの出力の典型的なエラーがデータセット間で比較できるという観察によって実現されている。
論文 参考訳(メタデータ) (2024-02-02T21:57:58Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Hard-label Manifolds: Unexpected Advantages of Query Efficiency for
Finding On-manifold Adversarial Examples [67.23103682776049]
画像分類モデルに対する最近のゼロオーダーのハードラベル攻撃は、ファーストオーダーのグラデーションレベルの代替品に匹敵する性能を示している。
最近、グラデーションレベルの設定では、通常の敵対的な例がデータ多様体から離れ、オンマニホールドの例が実際には一般化エラーであることが示されている。
雑音の多い多様体距離オラクルに基づく情報理論論的議論を提案し、敵の勾配推定を通じて多様体情報を漏洩させる。
論文 参考訳(メタデータ) (2021-03-04T20:53:06Z) - Learning Causal Models Online [103.87959747047158]
予測モデルは、予測を行うためにデータの急激な相関に依存することができる。
強い一般化を達成するための一つの解決策は、モデルに因果構造を組み込むことである。
本稿では,突発的特徴を継続的に検出・除去するオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-12T20:49:20Z) - A Critical View of the Structural Causal Model [89.43277111586258]
相互作用を全く考慮せずに原因と効果を識別できることが示される。
本稿では,因果モデルの絡み合った構造を模倣する新たな逆行訓練法を提案する。
我々の多次元手法は, 合成および実世界の両方のデータセットにおいて, 文献的手法よりも優れている。
論文 参考訳(メタデータ) (2020-02-23T22:52:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。