論文の概要: A Fast Kernel-based Conditional Independence test with Application to Causal Discovery
- arxiv url: http://arxiv.org/abs/2505.11085v1
- Date: Fri, 16 May 2025 10:14:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:14.666677
- Title: A Fast Kernel-based Conditional Independence test with Application to Causal Discovery
- Title(参考訳): 高速カーネル・コンディショナルインデペンデンステストと因果発見への応用
- Authors: Oliver Schacht, Biwei Huang,
- Abstract要約: FastKCIは、スケーラブルで並列化可能なカーネルベースの条件付き独立テストである。
実世界の生産データに関する合成データセットとベンチマークの実験は、FastKCIが元のKCIテストの統計力を維持していることを検証する。
- 参考スコア(独自算出の注目度): 9.416064439922001
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Kernel-based conditional independence (KCI) testing is a powerful nonparametric method commonly employed in causal discovery tasks. Despite its flexibility and statistical reliability, cubic computational complexity limits its application to large datasets. To address this computational bottleneck, we propose \textit{FastKCI}, a scalable and parallelizable kernel-based conditional independence test that utilizes a mixture-of-experts approach inspired by embarrassingly parallel inference techniques for Gaussian processes. By partitioning the dataset based on a Gaussian mixture model over the conditioning variables, FastKCI conducts local KCI tests in parallel, aggregating the results using an importance-weighted sampling scheme. Experiments on synthetic datasets and benchmarks on real-world production data validate that FastKCI maintains the statistical power of the original KCI test while achieving substantial computational speedups. FastKCI thus represents a practical and efficient solution for conditional independence testing in causal inference on large-scale data.
- Abstract(参考訳): カーネルベースの条件独立テスト(KCI)は、因果発見タスクで一般的に使用される強力な非パラメトリック手法である。
その柔軟性と統計的信頼性にもかかわらず、立方体計算の複雑さは、その応用を大きなデータセットに制限する。
この計算ボトルネックに対処するために、ガウス過程の恥ずかしい並列推論技術にインスパイアされた実験の混合アプローチを利用する、スケーラブルで並列化可能なカーネルベースの条件独立テストである \textit{FastKCI} を提案する。
条件変数上のガウス混合モデルに基づいてデータセットを分割することにより、FastKCIは局所的なKCIテストを並列に実行し、重み付けされたサンプリングスキームを用いて結果を集約する。
実世界の生産データに関する合成データセットとベンチマークの実験は、FastKCIが元のKCIテストの統計能力を維持しつつ、相当な計算スピードアップを達成することを証明している。
したがって、FastKCIは大規模データの因果推論における条件付き独立性テストのための実用的で効率的なソリューションである。
関連論文リスト
- Amortized Conditional Independence Testing [6.954510776782872]
ACIDは、条件付き独立性のテストを学ぶトランスフォーマーベースのニューラルネットワークアーキテクチャである。
複数のメトリクスの下で、既存のベースラインに対する最先端のパフォーマンスを一貫して達成します。
標本のサイズ、次元、および非常に低い推論時間を持つ非線形性に頑健に一般化することができる。
論文 参考訳(メタデータ) (2025-02-28T10:29:56Z) - An Efficient Permutation-Based Kernel Two-Sample Test [13.229867216847534]
2サンプル仮説テストは統計学と機械学習の基本的な問題である。
本研究では,最大平均誤差(MMD)のNystr "om approxation"を用いて,計算効率よく実用的なテストアルゴリズムを設計する。
論文 参考訳(メタデータ) (2025-02-19T09:22:48Z) - On sample complexity of conditional independence testing with Von Mises
estimator with application to causal discovery [21.12645737093305]
条件付き独立テストは制約に基づく因果探索アルゴリズムにおいて不可欠なステップである。
我々は、最適パラメトリックレートを達成するVM-CIと呼ばれる推定器に基づいて、条件独立性の試験を設計する。
VM-CIは、時間またはサンプルの複雑さの観点から、他の一般的なCIテストよりも優れていることを実証的に示します。
論文 参考訳(メタデータ) (2023-10-20T14:52:25Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Importance sampling for stochastic quantum simulations [68.8204255655161]
我々は、係数に応じてハミルトン式からサンプリングしてランダムな積公式を構築するqDriftプロトコルを導入する。
サンプリング段階における個別のシミュレーションコストを考慮し、同じ精度でシミュレーションコストを削減可能であることを示す。
格子核効果場理論を用いて数値シミュレーションを行った結果, 実験結果が得られた。
論文 参考訳(メタデータ) (2022-12-12T15:06:32Z) - FaDIn: Fast Discretized Inference for Hawkes Processes with General
Parametric Kernels [82.53569355337586]
この研究は、有限なサポートを持つ一般パラメトリックカーネルを用いた時間点プロセス推論の効率的な解を提供する。
脳磁図(MEG)により記録された脳信号からの刺激誘発パターンの発生をモデル化し,その有効性を評価する。
その結果,提案手法により,最先端技術よりもパターン遅延の推定精度が向上することが示唆された。
論文 参考訳(メタデータ) (2022-10-10T12:35:02Z) - Efficient Aggregated Kernel Tests using Incomplete $U$-statistics [22.251118308736327]
提案した3つのテストは、複数のカーネル帯域に集約され、さまざまなスケールでnullからの離脱を検出する。
提案した線形時間集約テストは,現在最先端の線形時間カーネルテストよりも高い出力が得られることを示す。
論文 参考訳(メタデータ) (2022-06-18T12:30:06Z) - Federated Doubly Stochastic Kernel Learning for Vertically Partitioned
Data [93.76907759950608]
本稿では,垂直分割データに対する2倍のカーネル学習アルゴリズムを提案する。
本稿では,FDSKLがカーネルを扱う場合,最先端のフェデレーション学習手法よりもはるかに高速であることを示す。
論文 参考訳(メタデータ) (2020-08-14T05:46:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。