論文の概要: Fourier Feature Methods for Nonlinear Causal Discovery: FFML Scoring and FFCI Testing in Mixed Data
- arxiv url: http://arxiv.org/abs/2605.05743v1
- Date: Thu, 07 May 2026 06:34:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.568179
- Title: Fourier Feature Methods for Nonlinear Causal Discovery: FFML Scoring and FFCI Testing in Mixed Data
- Title(参考訳): 非線形因果探索のためのフーリエ特徴法:混合データにおけるFFMLスコーリングとFFCIテスト
- Authors: Joseph D. Ramsey,
- Abstract要約: 因果発見のための実用的なツールキットを構成する2つの補完的RFF法を提案する。
FFML は n x n 核のグラマー行列を有限次元の特徴表現に置き換えることで、正確な GP 限界確率を近似する。
FFCIは、混合データに対する高速な非パラメトリックCIテストである。
- 参考スコア(独自算出の注目度): 1.3085880254118603
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gaussian process marginal likelihood scores and kernel conditional independence tests are theoretically appealing for nonlinear causal discovery but computationally prohibitive at scale. We present two complementary RFF-based methods forming a practical toolkit for score-based, constraint-based, and hybrid causal discovery. The Fourier Feature Marginal Likelihood (FFML) score approximates the exact GP marginal likelihood by replacing the n x n kernel Gram matrix with a finite-dimensional feature representation, reducing cost to O(nm^2 + m^3) while retaining the probabilistic interpretation and automatic complexity penalty of the exact score. FFML extends to mixed (continuous + discrete) parent sets via a product-kernel construction, with a Kronecker path for small discrete parent sets and a Hadamard-product path otherwise. The Fourier Feature Conditional Independence (FFCI) test is a fast nonparametric CI test for mixed data. Each variable is featurized individually: continuous variables via RFF or Orthogonal Random Features (ORF), discrete variables via a Cholesky-factored categorical feature map, with blocks concatenated. Conditioning uses ridge residualization in feature space; the test statistic is a Frobenius norm of the residualized cross-covariance, approximated as a weighted sum of chi-squared variables. Although FFML and FFCI share the same RFF/ORF machinery, they differ architecturally: FFML builds a joint kernel over a parent set for scoring, while FFCI featurizes variables individually for testing. We compare FFML to TRFF, a penalized Student-t regression alternative. Empirically, BOSS+FFML outperforms linear and kernel-ridge baselines on nonlinear data. When run through the same PC-Max implementation, FFCI and RCIT exhibit complementary precision-recall profiles: RCIT is more precise while FFCI achieves better recall and lower SHD, and runs in one third the time.
- Abstract(参考訳): ガウス過程の限界確率スコアと核条件独立試験は理論的には非線形因果発見に訴えるが、大規模には計算が禁じられている。
本稿では、スコアベース、制約ベース、ハイブリッド因果発見のための実用的なツールキットを構成する2つのRFFベースの補完手法を提案する。
Fourier Feature Marginal Likelihood (FFML) スコアは、 n x n のカーネルグラム行列を有限次元の特徴表現に置き換え、O(nm^2 + m^3) にコストを削減し、正確なスコアの確率論的解釈と自動複雑性のペナルティを維持することによって、正確な GP 限界確率を近似する。
FFMLは、製品とカーネルの構成を通じて混合(連続または離散)の親集合に拡張され、小さな離散な親集合に対するクロネッカー経路と、そうでなければアダマール積経路がある。
Fourier Feature Conditional Independence (FFCI)テストは、混合データに対する高速な非パラメトリックCIテストである。
連続変数は RFF または Orthogonal Random Features (ORF) を経由し、離散変数は Cholesky-factored categorical feature map を経由し、ブロックは連結される。
条件付けは特徴空間におけるリッジ残差化を使い、テスト統計学は残留化クロス共分散のフロベニウスノルムであり、カイ二乗変数の重み付け和として近似される。
FFMLとFFCIは同じRFF/ORFマシンを共有しているが、アーキテクチャ的には異なる。
我々は FFML と TRFF を比較した。
経験的に、BOSS+FFMLは非線形データに基づいて線形およびカーネルリッジベースラインより優れている。
同じPC-Max実装を実行すると、FFCIとRCITは補完的な精度のリコールプロファイルを示す: RCITはより正確であり、FFCIはより優れたリコールと低いSHDを達成する。
関連論文リスト
- Riemannian MeanFlow for One-Step Generation on Manifolds [54.09734511705173]
フローマッチングは、生成モデルのシミュレーション不要なトレーニングを可能にする。
平均フローは、位置依存接空間に速度が存在する多様体値生成に拡張することができる。
球面, トーリ, SO(3)における実験は, 品質・効率のトレードオフを改善し, サンプリングコストを大幅に削減して, 競争力のある一段階サンプリングを実証した。
論文 参考訳(メタデータ) (2026-03-11T12:41:46Z) - Wild Bootstrap Inference for Non-Negative Matrix Factorization with Random Effects [0.0]
ランダム効果をもつ非負行列分解(NMF-RE)を導入する。
我々は、彼らの効果的な自由度を監視し、ほぼ飽和したフィットを防ぐために、dfベースのキャップを強制する。
for inference on $$, we condition on $(widehat X,widehat U)$ and obtained fast uncertainty via linearization, a one-step Newton update, and a multiplier (wild) bootstrap。
論文 参考訳(メタデータ) (2026-03-02T05:29:46Z) - Kernel Learning for Regression via Quantum Annealing Based Spectral Sampling [0.7734726150561088]
本稿では,マルコフ連鎖モンテカルロサンプリングの代わりにQAを統合するQA-in-the-loopカーネル学習フレームワークを提案する。
我々は,データ適応型カーネルを構築し,Nadaraya--Watson(NW)回帰を行う。
複数のベンチマーク回帰データセットの実験では、カーネルマトリックスの構造変更に伴うトレーニング損失の減少が示されている。
論文 参考訳(メタデータ) (2026-01-13T16:50:07Z) - Regularized Random Fourier Features and Finite Element Reconstruction for Operator Learning in Sobolev Space [0.7734726150561088]
カーネルベースの演算子学習は、標準的な方法よりも少ないトレーニングを必要とする正確で理論上正当化された近似を提供することができる。
有限要素再構成マップ(RRFF-FEM)と組み合わせた正規化ランダムフーリエ特徴量(RRFF)手法を提案する。
RRFF と RRFF-FEM は雑音に対して頑健であり,非正規化ランダム特徴モデルと比較してトレーニング時間を短縮し,性能の向上を図っている。
論文 参考訳(メタデータ) (2025-12-19T18:36:24Z) - Exact spectral form factors of non-interacting fermions with Dyson statistics [0.0]
スペクトル形成因子(SFF)は、量子多体系におけるランダム行列の振る舞いの強力な診断である。
SFFをテキストテクスチャ的に計算できるランダム回路アンサンブルのファミリーを導入する。
我々は、回路アンサンブルの整合回路表現を開発し、量子シミュレータにおける実験的な実現を可能にした。
論文 参考訳(メタデータ) (2024-10-10T18:00:00Z) - On the Size and Approximation Error of Distilled Sets [57.61696480305911]
カーネル・インジェクション・ポイント(Kernel Inducing Points)などのデータセット蒸留のカーネル・リッジ回帰に基づく手法について理論的に考察する。
我々は、RFF空間におけるその解が元のデータの解と一致するように、元の入力空間に小さな一組のインスタンスが存在することを証明した。
KRR溶液は、全入力データに最適化されたKRR溶液に対して近似を与えるこの蒸留されたインスタンスセットを用いて生成することができる。
論文 参考訳(メタデータ) (2023-05-23T14:37:43Z) - Factorizers for Distributed Sparse Block Codes [45.29870215671697]
分散ブロック符号(SBC)を高速かつ高精度に分解する手法を提案する。
我々の反復分解器は、しきい値に基づく非線形活性化、条件付きランダムサンプリング、および $ell_infty$-based similarity metricを導入している。
CIFAR-100, ImageNet-1K, RAVENデータセット上での4つの深層CNNアーキテクチャの実現可能性を示す。
論文 参考訳(メタデータ) (2023-03-24T12:31:48Z) - FeDXL: Provable Federated Learning for Deep X-Risk Optimization [105.17383135458897]
我々は、既存のアルゴリズムが適用できないXリスクのファミリーを最適化するために、新しい連邦学習(FL)問題に取り組む。
Xリスクに対するFLアルゴリズムを設計する際の課題は、複数のマシンに対する目的の非可逆性と、異なるマシン間の相互依存にある。
論文 参考訳(メタデータ) (2022-10-26T00:23:36Z) - A Random Matrix Analysis of Random Fourier Features: Beyond the Gaussian
Kernel, a Precise Phase Transition, and the Corresponding Double Descent [85.77233010209368]
本稿では、データサンプルの数が$n$である現実的な環境で、ランダムフーリエ(RFF)回帰の正確さを特徴付けます。
この分析はまた、大きな$n,p,N$のトレーニングとテスト回帰エラーの正確な推定も提供する。
論文 参考訳(メタデータ) (2020-06-09T02:05:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。