論文の概要: Efficient Ensemble Conditional Independence Test Framework for Causal Discovery
- arxiv url: http://arxiv.org/abs/2509.21021v1
- Date: Thu, 25 Sep 2025 11:31:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.866462
- Title: Efficient Ensemble Conditional Independence Test Framework for Causal Discovery
- Title(参考訳): 因果発見のための効率的なアンサンブル独立テストフレームワーク
- Authors: Zhengkang Guan, Kun Kuang,
- Abstract要約: 本稿では,汎用およびプラグアンドプレイフレームワークであるEnsemble Conditional Independence Test (E-CIT)を紹介する。
E-CITはデータをサブセットに分割し、与えられたベースCITを各サブセットに独立に適用し、結果として得られるp値を集約する。
その結果、E-CITはCITの計算負担と因果発見を著しく低減するだけでなく、競争性能も向上することが示された。
- 参考スコア(独自算出の注目度): 46.328102756312724
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Constraint-based causal discovery relies on numerous conditional independence tests (CITs), but its practical applicability is severely constrained by the prohibitive computational cost, especially as CITs themselves have high time complexity with respect to the sample size. To address this key bottleneck, we introduce the Ensemble Conditional Independence Test (E-CIT), a general and plug-and-play framework. E-CIT operates on an intuitive divide-and-aggregate strategy: it partitions the data into subsets, applies a given base CIT independently to each subset, and aggregates the resulting p-values using a novel method grounded in the properties of stable distributions. This framework reduces the computational complexity of a base CIT to linear in the sample size when the subset size is fixed. Moreover, our tailored p-value combination method offers theoretical consistency guarantees under mild conditions on the subtests. Experimental results demonstrate that E-CIT not only significantly reduces the computational burden of CITs and causal discovery but also achieves competitive performance. Notably, it exhibits an improvement in complex testing scenarios, particularly on real-world datasets.
- Abstract(参考訳): 制約に基づく因果探索は、多くの条件付き独立試験(CIT)に依存するが、その実用性は、特にCIT自体がサンプルサイズに関して高い時間的複雑さを持つため、禁止的な計算コストによって厳しく制約されている。
このボトルネックに対処するために,汎用およびプラグイン・アンド・プレイのフレームワークであるEnsemble Conditional Independence Test (E-CIT)を導入する。
E-CITは、データをサブセットに分割し、与えられたベースCITを各サブセットに独立に適用し、安定した分布の性質を基礎とした新しい方法を用いて結果のp-値を集約する。
このフレームワークは、サブセットサイズが固定された場合、ベースCITの計算複雑性をサンプルサイズで線形に削減する。
さらに, 提案手法は, サブテストの温和条件下での理論的整合性を保証する。
実験結果から,E-CITはCITの計算負担と因果発見を著しく低減するだけでなく,競争性能も向上することが示された。
特に、特に実世界のデータセットにおいて、複雑なテストシナリオが改善されている。
関連論文リスト
- A Sample Efficient Conditional Independence Test in the Presence of Discretization [54.047334792855345]
離散化されたデータに直接条件付き独立テスト(CI)は、誤った結論につながる可能性がある。
最近の進歩は、観測データをバイナライズすることで、潜伏変数間の適切なCI関係を推測することを目指している。
そこで本研究では,バイナライゼーションプロセスに依存しないサンプル効率のCIテストを提案する。
論文 参考訳(メタデータ) (2025-06-10T12:41:26Z) - A Fast Kernel-based Conditional Independence test with Application to Causal Discovery [9.416064439922001]
FastKCIは、スケーラブルで並列化可能なカーネルベースの条件付き独立テストである。
実世界の生産データに関する合成データセットとベンチマークの実験は、FastKCIが元のKCIテストの統計力を維持していることを検証する。
論文 参考訳(メタデータ) (2025-05-16T10:14:57Z) - Stochastic Optimization with Optimal Importance Sampling [49.484190237840714]
本稿では,両者の時間的分離を必要とせずに,意思決定とIS分布を共同で更新する反復型アルゴリズムを提案する。
本手法は,IS分布系に対する目的的,軽度な仮定の凸性の下で,最小の変数分散を達成し,大域収束を保証する。
論文 参考訳(メタデータ) (2025-04-04T16:10:18Z) - Amortized Conditional Independence Testing [6.954510776782872]
ACIDは、条件付き独立性のテストを学ぶトランスフォーマーベースのニューラルネットワークアーキテクチャである。
複数のメトリクスの下で、既存のベースラインに対する最先端のパフォーマンスを一貫して達成します。
標本のサイズ、次元、および非常に低い推論時間を持つ非線形性に頑健に一般化することができる。
論文 参考訳(メタデータ) (2025-02-28T10:29:56Z) - Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - On sample complexity of conditional independence testing with Von Mises
estimator with application to causal discovery [21.12645737093305]
条件付き独立テストは制約に基づく因果探索アルゴリズムにおいて不可欠なステップである。
我々は、最適パラメトリックレートを達成するVM-CIと呼ばれる推定器に基づいて、条件独立性の試験を設計する。
VM-CIは、時間またはサンプルの複雑さの観点から、他の一般的なCIテストよりも優れていることを実証的に示します。
論文 参考訳(メタデータ) (2023-10-20T14:52:25Z) - Conditional Independence Testing via Latent Representation Learning [2.566492438263125]
LCIT(Latent representation based Conditional Independence Test)は、表現学習に基づく条件付き独立テストのための新しい非パラメトリック手法である。
我々の主な貢献は、Z が与えられた X と Y の独立性をテストするための生成的枠組みの提案である。
論文 参考訳(メタデータ) (2022-09-04T07:16:03Z) - Private Quantiles Estimation in the Presence of Atoms [7.5072219939358105]
データセットの複数の量子化の差分プライベートな推定に対処する。
Non-smoothed JointExpは、ピークの分布において重要なパフォーマンスの欠如に悩まされている。
我々はHuristically Smoothed JointExpという,単純かつ数値的に効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-02-15T09:44:14Z) - Differential privacy and robust statistics in high dimensions [49.50869296871643]
高次元Propose-Test-Release (HPTR) は指数的メカニズム、頑健な統計、Propose-Test-Release メカニズムという3つの重要なコンポーネントの上に構築されている。
本論文では,HPTRが複数のシナリオで最適サンプル複雑性をほぼ達成していることを示す。
論文 参考訳(メタデータ) (2021-11-12T06:36:40Z) - Repulsive Mixture Models of Exponential Family PCA for Clustering [127.90219303669006]
指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
本稿では, 混合成分間での反発性増感前処理を導入し, ベイズ式に分散EPCA混合(DEPCAM)モデルを開発した。
論文 参考訳(メタデータ) (2020-04-07T04:07:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。