論文の概要: A Permutation-Free Kernel Independence Test
- arxiv url: http://arxiv.org/abs/2212.09108v1
- Date: Sun, 18 Dec 2022 15:28:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 16:04:01.948367
- Title: A Permutation-Free Kernel Independence Test
- Title(参考訳): 置換フリーカーネル独立性試験
- Authors: Shubhanshu Shekhar, Ilmun Kim, Aaditya Ramdas
- Abstract要約: 非パラメトリック独立試験では、i.d. data $(X_i,Y_i)_i=1n$, where $X in MathcalX, Y in MathcalY$ is in any general space。
カーネルHilbert-Schmidt Independence Criterion (HSIC) や Distance Covariance (dCov) のような現代のテスト統計は、基礎となるU統計の縮退により、難解なnull分布を持つ。
- 参考スコア(独自算出の注目度): 36.50719125230106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In nonparametric independence testing, we observe i.i.d.\ data
$\{(X_i,Y_i)\}_{i=1}^n$, where $X \in \mathcal{X}, Y \in \mathcal{Y}$ lie in
any general spaces, and we wish to test the null that $X$ is independent of
$Y$. Modern test statistics such as the kernel Hilbert-Schmidt Independence
Criterion (HSIC) and Distance Covariance (dCov) have intractable null
distributions due to the degeneracy of the underlying U-statistics. Thus, in
practice, one often resorts to using permutation testing, which provides a
nonasymptotic guarantee at the expense of recalculating the quadratic-time
statistics (say) a few hundred times. This paper provides a simple but
nontrivial modification of HSIC and dCov (called xHSIC and xdCov, pronounced
``cross'' HSIC/dCov) so that they have a limiting Gaussian distribution under
the null, and thus do not require permutations. This requires building on the
newly developed theory of cross U-statistics by Kim and Ramdas (2020), and in
particular developing several nontrivial extensions of the theory in Shekhar et
al. (2022), which developed an analogous permutation-free kernel two-sample
test. We show that our new tests, like the originals, are consistent against
fixed alternatives, and minimax rate optimal against smooth local alternatives.
Numerical simulations demonstrate that compared to the full dCov or HSIC, our
variants have the same power up to a $\sqrt 2$ factor, giving practitioners a
new option for large problems or data-analysis pipelines where computation, not
sample size, could be the bottleneck.
- Abstract(参考訳): 非パラメトリック独立テストでは、i.d.\ data $\{(X_i,Y_i)\}_{i=1}^n$, where $X \in \mathcal{X}, Y \in \mathcal{Y}$が任意の一般空間に存在し、$X$が$Y$から独立であるようなnullをテストする。
カーネルHilbert-Schmidt Independence Criterion (HSIC) や Distance Covariance (dCov) のような現代のテスト統計は、基礎となるU統計の縮退により、難解なnull分布を持つ。
本稿では HSIC と dCov (xHSIC and xdCov, 発音は `cross'' の HSIC/dCov) の単純かつ非自明な修正を提供し、それらが null の下でガウス分布を制限するので、置換は不要である。
これは、Kim and Ramdas (2020) によって新たに開発されたクロスU統計学の理論に基づいて構築され、特にシェハールら(2022)におけるいくつかの非自明な拡張を開発する必要がある。
数値シミュレーションにより、dCovやHSICと比較して、我々の変種は同じパワーを$\sqrt 2$ factorまで持つことが示され、大規模な問題やサンプルサイズではなく計算がボトルネックとなるようなデータ分析パイプラインに対する新たな選択肢が実現された。
- The Minimax Rate of HSIC Estimation for Translation-Invariant Kernels [0.0]
連続有界変換不変特性核を持つガウス環を含むボレル測度に対する$mathbb Rd$のHSIC推定の最小値が$mathcal O!left(n-1/2right)$であることを証明する。
論文 参考訳(メタデータ) (2024-03-12T15:13:21Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Differentially Private Conditional Independence Testing [35.376975903797444]
論文 参考訳(メタデータ) (2023-06-11T16:46:00Z) - Sharp Constants in Uniformity Testing via the Huber Statistic [16.384142529375435]
一様性テスト(英: Uniformity testing)は、プロパティテストにおいて最もよく研究されている問題の1つである。
衝突試験機は, 均一入力と非一様入力の分離の標準偏差数において, 急激な最大定数を達成することを示す。
論文 参考訳(メタデータ) (2022-06-21T20:43:53Z) - Exact Paired-Permutation Testing for Structured Test Statistics [67.71280539312536]
論文 参考訳(メタデータ) (2022-05-03T11:00:59Z) - A Kernel Test for Causal Association via Noise Contrastive Backdoor Adjustment [18.791409397894835]
我々は、textitdo-null仮説である$H_0:; p(y|textit do(X=x))=p(y)$をテストする非パラメトリックな方法を開発した。
我々は,バックドアHSIC (bd-HSIC) が校正され,多数の共同設立者の下でバイナリと継続的治療を行う能力を持っていることを実証した。
論文 参考訳(メタデータ) (2021-11-25T19:12:37Z) - The Sample Complexity of Robust Covariance Testing [56.98280399449707]
i. i. d.
形式 $Z = (1-epsilon) X + epsilon B$ の分布からのサンプル。ここで $X$ はゼロ平均で未知の共分散である Gaussian $mathcalN(0, Sigma)$ である。
サンプル複雑性の上限が $omega(d2)$ for $epsilon$ an arbitrarily small constant and $gamma であることを証明します。
論文 参考訳(メタデータ) (2020-12-31T18:24:41Z) - Dimension-agnostic inference using cross U-statistics [33.17951971728784]
論文 参考訳(メタデータ) (2020-11-10T12:21:34Z) - Optimal Testing of Discrete Distributions with High Probability [49.19942805582874]
論文 参考訳(メタデータ) (2020-09-14T16:09:17Z) - Locally Private Hypothesis Selection [96.06118559817057]
論文 参考訳(メタデータ) (2020-02-21T18:30:48Z)