論文の概要: Fourier Feature Methods for Nonlinear Causal Discovery: FFML Scoring, TRFF Scoring, and FFCI Testing in Mixed Data
- arxiv url: http://arxiv.org/abs/2605.05743v2
- Date: Sun, 10 May 2026 17:25:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 16:21:29.38668
- Title: Fourier Feature Methods for Nonlinear Causal Discovery: FFML Scoring, TRFF Scoring, and FFCI Testing in Mixed Data
- Title(参考訳): 非線形因果探索のためのフーリエ特徴法:混合データにおけるFFML Scoring, TRFF Scoring, FFCI Testing
- Authors: Joseph D. Ramsey,
- Abstract要約: 因果発見のための実用的なツールキットを構成する3つの補完的RFF法を提案する。
FFMLスコアは、$n x n$のカーネルグラム行列を有限次元の特徴表現に置き換えることで、正確なGPマージンの確率を近似する。
TRFFスコアは、重い尾のノイズに対して堅牢性を提供し、FFMLよりも高速なランタイムを提供する。
- 参考スコア(独自算出の注目度): 1.3085880254118603
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gaussian process (GP) marginal likelihood scores and kernel conditional independence tests are theoretically appealing for nonlinear causal discovery but computationally prohibitive at scale. We present three complementary RFF-based methods forming a practical toolkit for score-based, constraint-based, and hybrid causal discovery. The Fourier Feature Marginal Likelihood (FFML) score approximates the exact GP marginal likelihood by replacing the $n x n$ kernel Gram matrix with a finite-dimensional feature representation, reducing cost to $O(nm^2 + m^3)$ while retaining the probabilistic interpretation and automatic complexity penalty of the exact score. FFML extends to mixed (continuous and discrete) parent sets via a product-kernel construction, with a Kronecker path for small discrete parent sets and a Hadamard-product path otherwise. The Tetrad Random Fourier Feature (TRFF) score is a complementary BIC-style alternative using penalized Student-t regression with random Fourier features. TRFF offers robustness to heavy-tailed noise and faster runtime than FFML. Empirically, TRFF and FFML exhibit a complementary precision-recall profile: TRFF achieves higher precision while FFML achieves better recall and lower SHD overall. The Fourier Feature Conditional Independence (FFCI) test is a fast nonparametric CI test for mixed data, using ridge residualization in feature space and a Frobenius-norm cross-covariance statistic approximated as a weighted sum of chi-squared variables. Empirically, BOSS+FFML achieves the lowest SHD on nonlinear data, while BOSS+TRFF offers the highest precision. When run through PC-Max, FFCI and RCIT exhibit complementary precision-recall profiles: RCIT is more precise while FFCI achieves better recall and substantially lower SHD, at approximately twice the runtime.
- Abstract(参考訳): ガウス過程(GP)の限界確率スコアとカーネル条件独立試験は、理論的には非線形因果発見に訴えるが、大規模に計算的に禁止される。
本稿では, スコアベース, 制約ベース, ハイブリッド因果発見のための実用的なツールキットを構成する3つの補完的RFF法を提案する。
Fourier Feature Marginal Likelihood (FFML) スコアは、$n x n$ kernel Gram matrixを有限次元の特徴表現に置き換え、コストを$O(nm^2 + m^3)$に削減し、正確なスコアの確率論的解釈と自動複雑化のペナルティを保ちながら、正確なGP限界率を近似する。
FFMLは製品カーネル構造を通じて混合された(連続かつ離散的な)親集合に拡張され、小さな離散な親集合に対するクロネッカー経路と、そうでなければアダマール-生成経路がある。
Tetrad Random Fourier Feature (TRFF) スコアは、無作為なフーリエ特徴を持つPentalized Students-tレグレッションを用いた、補完的なBICスタイルの代替品である。
TRFFは、重い尾のノイズに対して堅牢性を提供し、FFMLよりも高速なランタイムを提供する。
実験的に、TRFFとFFMLは相補的な精度-リコールプロファイルを示す: TRFFは高い精度を達成し、FFMLは全体的なリコールとSHDの低下を達成する。
Fourier Feature Conditional Independence (FFCI) テストは混合データに対する高速な非パラメトリックCIテストであり、特徴空間のリッジ残差化とカイ二乗変数の重み付け和として近似されたフロベニウス-ノーム交叉共分散統計量を用いている。
経験的に、BOSS+FFMLは非線形データ上で最低のSHDを達成するが、BOSS+TRFFは最高精度を提供する。
PC-Maxを通すと、FFCIとRCITは補完的な精度のリコールプロファイルを示す: RCITはより正確であり、FFCIはより優れたリコールとSHDをほぼ2倍の低速で達成する。
関連論文リスト
- Riemannian MeanFlow for One-Step Generation on Manifolds [54.09734511705173]
フローマッチングは、生成モデルのシミュレーション不要なトレーニングを可能にする。
平均フローは、位置依存接空間に速度が存在する多様体値生成に拡張することができる。
球面, トーリ, SO(3)における実験は, 品質・効率のトレードオフを改善し, サンプリングコストを大幅に削減して, 競争力のある一段階サンプリングを実証した。
論文 参考訳(メタデータ) (2026-03-11T12:41:46Z) - Wild Bootstrap Inference for Non-Negative Matrix Factorization with Random Effects [0.0]
ランダム効果をもつ非負行列分解(NMF-RE)を導入する。
我々は、彼らの効果的な自由度を監視し、ほぼ飽和したフィットを防ぐために、dfベースのキャップを強制する。
for inference on $$, we condition on $(widehat X,widehat U)$ and obtained fast uncertainty via linearization, a one-step Newton update, and a multiplier (wild) bootstrap。
論文 参考訳(メタデータ) (2026-03-02T05:29:46Z) - Kernel Learning for Regression via Quantum Annealing Based Spectral Sampling [0.7734726150561088]
本稿では,マルコフ連鎖モンテカルロサンプリングの代わりにQAを統合するQA-in-the-loopカーネル学習フレームワークを提案する。
我々は,データ適応型カーネルを構築し,Nadaraya--Watson(NW)回帰を行う。
複数のベンチマーク回帰データセットの実験では、カーネルマトリックスの構造変更に伴うトレーニング損失の減少が示されている。
論文 参考訳(メタデータ) (2026-01-13T16:50:07Z) - Regularized Random Fourier Features and Finite Element Reconstruction for Operator Learning in Sobolev Space [0.7734726150561088]
カーネルベースの演算子学習は、標準的な方法よりも少ないトレーニングを必要とする正確で理論上正当化された近似を提供することができる。
有限要素再構成マップ(RRFF-FEM)と組み合わせた正規化ランダムフーリエ特徴量(RRFF)手法を提案する。
RRFF と RRFF-FEM は雑音に対して頑健であり,非正規化ランダム特徴モデルと比較してトレーニング時間を短縮し,性能の向上を図っている。
論文 参考訳(メタデータ) (2025-12-19T18:36:24Z) - Exact spectral form factors of non-interacting fermions with Dyson statistics [0.0]
スペクトル形成因子(SFF)は、量子多体系におけるランダム行列の振る舞いの強力な診断である。
SFFをテキストテクスチャ的に計算できるランダム回路アンサンブルのファミリーを導入する。
我々は、回路アンサンブルの整合回路表現を開発し、量子シミュレータにおける実験的な実現を可能にした。
論文 参考訳(メタデータ) (2024-10-10T18:00:00Z) - On the Size and Approximation Error of Distilled Sets [57.61696480305911]
カーネル・インジェクション・ポイント(Kernel Inducing Points)などのデータセット蒸留のカーネル・リッジ回帰に基づく手法について理論的に考察する。
我々は、RFF空間におけるその解が元のデータの解と一致するように、元の入力空間に小さな一組のインスタンスが存在することを証明した。
KRR溶液は、全入力データに最適化されたKRR溶液に対して近似を与えるこの蒸留されたインスタンスセットを用いて生成することができる。
論文 参考訳(メタデータ) (2023-05-23T14:37:43Z) - Factorizers for Distributed Sparse Block Codes [45.29870215671697]
分散ブロック符号(SBC)を高速かつ高精度に分解する手法を提案する。
我々の反復分解器は、しきい値に基づく非線形活性化、条件付きランダムサンプリング、および $ell_infty$-based similarity metricを導入している。
CIFAR-100, ImageNet-1K, RAVENデータセット上での4つの深層CNNアーキテクチャの実現可能性を示す。
論文 参考訳(メタデータ) (2023-03-24T12:31:48Z) - FeDXL: Provable Federated Learning for Deep X-Risk Optimization [105.17383135458897]
我々は、既存のアルゴリズムが適用できないXリスクのファミリーを最適化するために、新しい連邦学習(FL)問題に取り組む。
Xリスクに対するFLアルゴリズムを設計する際の課題は、複数のマシンに対する目的の非可逆性と、異なるマシン間の相互依存にある。
論文 参考訳(メタデータ) (2022-10-26T00:23:36Z) - A Random Matrix Analysis of Random Fourier Features: Beyond the Gaussian
Kernel, a Precise Phase Transition, and the Corresponding Double Descent [85.77233010209368]
本稿では、データサンプルの数が$n$である現実的な環境で、ランダムフーリエ(RFF)回帰の正確さを特徴付けます。
この分析はまた、大きな$n,p,N$のトレーニングとテスト回帰エラーの正確な推定も提供する。
論文 参考訳(メタデータ) (2020-06-09T02:05:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。