論文の概要: Scalable Causal Discovery from Recursive Nonlinear Data via Truncated Basis Function Scores and Tests
- arxiv url: http://arxiv.org/abs/2510.04276v1
- Date: Sun, 05 Oct 2025 16:34:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.554496
- Title: Scalable Causal Discovery from Recursive Nonlinear Data via Truncated Basis Function Scores and Tests
- Title(参考訳): 縮合基底関数スコアとテストによる再帰非線形データからのスケーラブル因果発見
- Authors: Joseph Ramsey, Bryan Andrews,
- Abstract要約: スケーラブルな因果発見のための2つの基礎拡張ツールを紹介する。
第一に、基底関数 BIC スコアは、非線型依存を近似するために、切り詰められた加法拡張を使用する。
第二に、BF-LRT(Basis Function Likelihood Ratio Test)は、ほぼ条件付き独立性テストを提供する。
- 参考スコア(独自算出の注目度): 1.228962043922484
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning graphical conditional independence structures from nonlinear, continuous or mixed data is a central challenge in machine learning and the sciences, and many existing methods struggle to scale to thousands of samples or hundreds of variables. We introduce two basis-expansion tools for scalable causal discovery. First, the Basis Function BIC (BF-BIC) score uses truncated additive expansions to approximate nonlinear dependencies. BF-BIC is theoretically consistent under additive models and extends to post-nonlinear (PNL) models via an invertible reparameterization. It remains robust under moderate interactions and supports mixed data through a degenerate-Gaussian embedding for discrete variables. In simulations with fully nonlinear neural causal models (NCMs), BF-BIC outperforms kernel- and constraint-based methods (e.g., KCI, RFCI) in both accuracy and runtime. Second, the Basis Function Likelihood Ratio Test (BF-LRT) provides an approximate conditional independence test that is substantially faster than kernel tests while retaining competitive accuracy. Extensive simulations and a real-data application to Canadian wildfire risk show that, when integrated into hybrid searches, BF-based methods enable interpretable and scalable causal discovery. Implementations are available in Python, R, and Java.
- Abstract(参考訳): 非線形、連続または混合データからグラフィカルな条件付き独立構造を学ぶことは、機械学習と科学における中心的な課題であり、既存の多くの手法は数千のサンプルや数百の変数にスケールするのに苦労している。
スケーラブルな因果発見のための2つの基礎拡張ツールを紹介する。
第一に、基底関数 BIC (BF-BIC) スコアは、非線型依存を近似するために、切り詰められた加法拡張を使用する。
BF-BICは理論上は加法モデルの下で一貫しており、非線型(PNL)モデルにまで拡張可能である。
穏健な相互作用の下では頑健であり、離散変数に対する退化ガウスの埋め込みを通じて混合データをサポートする。
完全非線形神経因果モデル(NCM)を用いたシミュレーションでは、BF-BICはカーネルおよび制約ベースの手法(例えば、KCI、RFCI)を精度と実行時間の両方で上回る。
第二に、BF-LRT(Basis Function Likelihood Ratio Test)は、競合精度を維持しながら、カーネルテストよりもかなり高速な条件付き独立性テストを提供する。
広汎なシミュレーションと、カナダの山火事リスクに対するリアルタイムの応用は、ハイブリッド検索に統合されると、BFベースの手法が解釈可能でスケーラブルな因果発見を可能にすることを示している。
実装はPython、R、Javaで利用可能だ。
関連論文リスト
- Simulation-based inference via telescoping ratio estimation for trawl processes [0.0]
本稿では,高速で高精度なMarkovベースの推論フレームワークを提案する。
チェビシェフ近似を用いて独立な後続サンプルを効率よく生成し,連鎖モンテカルロ法が混在しても正確な推論を可能にする。
エネルギー需要データに適用した柔軟な無限分割可能なモデルのクラスであるトロールプロセスにおいて,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2025-10-05T05:26:46Z) - Robust variational neural posterior estimation for simulation-based inference [0.0]
頑健な変動性神経後部推定(RVNP)を導入する。
RVNPは、変分推論と誤りモデリングを用いた償却シミュレーションと現実間ギャップにおける誤特定の問題に対処する。
論文 参考訳(メタデータ) (2025-09-06T14:10:49Z) - Effortless, Simulation-Efficient Bayesian Inference using Tabular Foundation Models [5.952993835541411]
本研究では,TabPFNをシミュレーションベース推論のための自己回帰条件密度推定器として用いる方法を示す。
NPE-PFは、推論ネットワークの選択、トレーニング、ハイパーパラメータチューニングの必要性を排除する。
モデルミス特定に優れたロバスト性を示し、TabPFNのコンテキストサイズ限界を超えるシミュレーション予算にスケールできる。
論文 参考訳(メタデータ) (2025-04-24T15:29:39Z) - Robust Simulation-Based Inference under Missing Data via Neural Processes [6.32765579505162]
我々は,SBIにおける欠落データの問題を定式化し,本手法がSBI後部推定にバイアスをもたらすことを示す。
また,神経後部推定フレームワークにおいて,計算モデルと推論ネットワークを共同で学習することにより,この問題に対処する新しい補正手法を提案する。
論文 参考訳(メタデータ) (2025-03-03T08:22:01Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - Validation Diagnostics for SBI algorithms based on Normalizing Flows [55.41644538483948]
本研究は,NFに基づく多次元条件(後)密度推定器の検証診断を容易にすることを提案する。
また、局所的な一貫性の結果に基づいた理論的保証も提供する。
この作業は、より良い特定モデルの設計を支援したり、新しいSBIアルゴリズムの開発を促進するのに役立つだろう。
論文 参考訳(メタデータ) (2022-11-17T15:48:06Z) - A Hypergradient Approach to Robust Regression without Correspondence [85.49775273716503]
本稿では,入力データと出力データとの対応が不十分な回帰問題について考察する。
ほとんどの既存手法はサンプルサイズが小さい場合にのみ適用できる。
シャッフル回帰問題に対する新しい計算フレームワークであるROBOTを提案する。
論文 参考訳(メタデータ) (2020-11-30T21:47:38Z) - Flow-Based Likelihoods for Non-Gaussian Inference [0.0]
我々は、多くの科学的分析において重要な仮定を回避するためのデータ駆動可能性の使用について検討する。
有限標本サイズによるサンプリング誤差と同程度の精度で再現可能であることを示す。
データ内のさまざまなレベルのNGをキャプチャ可能な一連のテストを導入することで、従来のデータ駆動可能性の成功と失敗は、データのNG構造に結びつくことができることを示す。
論文 参考訳(メタデータ) (2020-07-10T18:00:00Z) - Learning Likelihoods with Conditional Normalizing Flows [54.60456010771409]
条件正規化フロー(CNF)はサンプリングと推論において効率的である。
出力空間写像に対する基底密度が入力 x 上で条件づけられた CNF について、条件密度 p(y|x) をモデル化する。
論文 参考訳(メタデータ) (2019-11-29T19:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。