論文の概要: A Martingale Kernel Independence Test
- arxiv url: http://arxiv.org/abs/2605.22549v1
- Date: Thu, 21 May 2026 14:31:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.300928
- Title: A Martingale Kernel Independence Test
- Title(参考訳): Martingale Kernel独立テスト
- Authors: Felix Laumann, Zhaolu Liu, Mauricio Barahona,
- Abstract要約: データ法則によらず、ヌル分布が標準正規である2つの学生統計を導入し、1つの正規量子ルックアップが置換ステップを完全に置き換える。
どちらの統計も経験的なタイプIエラー率と置換校正ベースラインのテストパワーと一致し、25ドルから60タイムスを高速に実行している。
- 参考スコア(独自算出の注目度): 2.171666762289619
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Hilbert-Schmidt Independence Criterion (HSIC) and its joint-independence extension $d\mathrm{HSIC}$ are degenerate $V$-statistics whose data-dependent weighted-$χ^2$ null limits force a permutation calibration that multiplies the per-test cost by the number of permutations, in practice two orders of magnitude. Adapting the recent martingale MMD construction for two-sample testing to the (joint) independence problem, we introduce two studentised statistics whose null distributions are standard normal regardless of the data law, so that a single normal-quantile lookup replaces the permutation step entirely. The first, $m\mathrm{HSIC}$, is a self-normalised lower-triangular sum of the Hadamard product of two empirically centred Gram matrices. Under independence and bounded-fourth-moment kernels it converges to a standard normal. It is consistent against every fixed alternative, and runs at quadratic cost in the sample size without any sample split, matching the biased HSIC $V$-statistic. Our second statistic, $md\mathrm{HSIC}$, achieves finite-sample consistency with a single half-sample split: the centring is estimated on one half and the lower-triangular self-normalised martingale is run on the other, shrinking the conditional-mean residual to a quantity that is exponentially small in $d$, so the statistic is asymptotically standard normal at every fixed number of jointly tested variables, with a per-test cost that grows only linearly in $d$. On synthetic data with per-variable input dimension from $1$ to $500$ and between $2$ and $10$ jointly tested variables, both statistics match the empirical type-I error rate and test power of permutation-calibrated baselines while running $25$ to $60\times$ faster.
- Abstract(参考訳): Hilbert-Schmidt Independence Criterion (HSIC)とその共同独立延長$d\mathrm{HSIC}$は、データ依存の重み付けを持つ$V$-statisticsを縮退させる。
近年のマーチンゲールMDD構築法は,データ法によらずヌル分布が通常の正規分布である2つの学生統計を導入し,通常の1つのルックアップが置換ステップを完全に置き換えた。
最初の$m\mathrm{HSIC}$は、2つの経験中心のグラム行列のアダマール積の自己正規化下三角和である。
独立性と有界な第4モーメント核の下では、標準正規に収束する。
固定された全ての代替品に対して一貫性があり、サンプルサイズではサンプル分割なしで二次的なコストで動作し、バイアス付きHSIC$V$-statisticと一致する。
2番目の統計学である $md\mathrm{HSIC}$ は、1つの半サンプルの分割で有限サンプルの整合性を達成する: セントリングは片側で推定され、下方三角形の自己正規化マルティンゲールは他方で実行され、条件平均残差は$d$で指数的に小さい量に縮小される。
変数ごとの入力次元が1ドルから500ドル、共同でテストされた変数が2ドルから10ドルの間の合成データでは、どちらの統計も経験的なタイプIエラー率と置換校正されたベースラインのテストパワーと一致し、25ドルから60ドルは高速である。
関連論文リスト
- TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.69084997173196]
奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。
近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。
1)予測共分散は予測平均のランダム性を真に捉えているか?
その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文 参考訳(メタデータ) (2023-10-29T09:54:03Z) - Online Learning with Adversaries: A Differential-Inclusion Analysis [52.43460995467893]
我々は,完全に非同期なオンラインフェデレート学習のための観察行列ベースのフレームワークを提案する。
我々の主な結果は、提案アルゴリズムがほぼ確実に所望の平均$mu.$に収束することである。
新たな差分包摂型2時間スケール解析を用いて,この収束を導出する。
論文 参考訳(メタデータ) (2023-04-04T04:32:29Z) - A Permutation-Free Kernel Independence Test [36.50719125230106]
非パラメトリック独立試験では、i.d. data $(X_i,Y_i)_i=1n$, where $X in MathcalX, Y in MathcalY$ is in any general space。
カーネルHilbert-Schmidt Independence Criterion (HSIC) や Distance Covariance (dCov) のような現代のテスト統計は、基礎となるU統計の縮退により、難解なnull分布を持つ。
本稿では,HSICの簡易かつ非自明な修正について述べる。
論文 参考訳(メタデータ) (2022-12-18T15:28:16Z) - Efficient Aggregated Kernel Tests using Incomplete $U$-statistics [22.251118308736327]
提案した3つのテストは、複数のカーネル帯域に集約され、さまざまなスケールでnullからの離脱を検出する。
提案した線形時間集約テストは,現在最先端の線形時間カーネルテストよりも高い出力が得られることを示す。
論文 参考訳(メタデータ) (2022-06-18T12:30:06Z) - Statistical Inference of Constrained Stochastic Optimization via Sketched Sequential Quadratic Programming [53.63469275932989]
制約付き非線形最適化問題のオンライン統計的推測を考察する。
これらの問題を解決するために、逐次二次計画法(StoSQP)を適用する。
論文 参考訳(メタデータ) (2022-05-27T00:34:03Z) - Variance-Aware Confidence Set: Variance-Dependent Bound for Linear
Bandits and Horizon-Free Bound for Linear Mixture MDP [76.94328400919836]
線形バンドイットと線形混合決定プロセス(mdp)に対する分散認識信頼セットの構築方法を示す。
線形バンドイットに対しては、$d を特徴次元とする$widetildeo(mathrmpoly(d)sqrt1 + sum_i=1ksigma_i2) が成り立つ。
線形混合 MDP に対し、$widetildeO(mathrmpoly(d)sqrtK)$ regret bound を得る。
論文 参考訳(メタデータ) (2021-01-29T18:57:52Z) - The Sample Complexity of Robust Covariance Testing [56.98280399449707]
i. i. d.
形式 $Z = (1-epsilon) X + epsilon B$ の分布からのサンプル。ここで $X$ はゼロ平均で未知の共分散である Gaussian $mathcalN(0, Sigma)$ である。
汚染がない場合、事前の研究は、$O(d)$サンプルを使用するこの仮説テストタスクの単純なテスターを与えた。
サンプル複雑性の上限が $omega(d2)$ for $epsilon$ an arbitrarily small constant and $gamma であることを証明します。
論文 参考訳(メタデータ) (2020-12-31T18:24:41Z) - Dimension-agnostic inference using cross U-statistics [33.17951971728784]
本稿では,サンプル分割と自己正規化とともに,既存のテスト統計の変分表現を用いた手法を提案する。
結果の統計学は、縮退したU統計を慎重に修正し、対角ブロックを落とし、対角ブロックを外したままにすると見なすことができる。
論文 参考訳(メタデータ) (2020-11-10T12:21:34Z) - Robustly Learning any Clusterable Mixture of Gaussians [55.41573600814391]
本研究では,高次元ガウス混合系の対向ロバスト条件下での効率的な学習性について検討する。
理論的に最適に近い誤り証明である$tildeO(epsilon)$の情報を、$epsilon$-corrupted $k$-mixtureで学習するアルゴリズムを提供する。
我々の主な技術的貢献は、ガウス混合系からの新しい頑健な識別可能性証明クラスターであり、これは正方形の定度証明システムによって捉えることができる。
論文 参考訳(メタデータ) (2020-05-13T16:44:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。