論文の概要: A Permutation-Free Kernel Independence Test
- arxiv url: http://arxiv.org/abs/2212.09108v1
- Date: Sun, 18 Dec 2022 15:28:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 16:04:01.948367
- Title: A Permutation-Free Kernel Independence Test
- Title(参考訳): 置換フリーカーネル独立性試験
- Authors: Shubhanshu Shekhar, Ilmun Kim, Aaditya Ramdas
- Abstract要約: 非パラメトリック独立試験では、i.d. data $(X_i,Y_i)_i=1n$, where $X in MathcalX, Y in MathcalY$ is in any general space。
カーネルHilbert-Schmidt Independence Criterion (HSIC) や Distance Covariance (dCov) のような現代のテスト統計は、基礎となるU統計の縮退により、難解なnull分布を持つ。
本稿では,HSICの簡易かつ非自明な修正について述べる。
- 参考スコア(独自算出の注目度): 36.50719125230106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In nonparametric independence testing, we observe i.i.d.\ data
$\{(X_i,Y_i)\}_{i=1}^n$, where $X \in \mathcal{X}, Y \in \mathcal{Y}$ lie in
any general spaces, and we wish to test the null that $X$ is independent of
$Y$. Modern test statistics such as the kernel Hilbert-Schmidt Independence
Criterion (HSIC) and Distance Covariance (dCov) have intractable null
distributions due to the degeneracy of the underlying U-statistics. Thus, in
practice, one often resorts to using permutation testing, which provides a
nonasymptotic guarantee at the expense of recalculating the quadratic-time
statistics (say) a few hundred times. This paper provides a simple but
nontrivial modification of HSIC and dCov (called xHSIC and xdCov, pronounced
``cross'' HSIC/dCov) so that they have a limiting Gaussian distribution under
the null, and thus do not require permutations. This requires building on the
newly developed theory of cross U-statistics by Kim and Ramdas (2020), and in
particular developing several nontrivial extensions of the theory in Shekhar et
al. (2022), which developed an analogous permutation-free kernel two-sample
test. We show that our new tests, like the originals, are consistent against
fixed alternatives, and minimax rate optimal against smooth local alternatives.
Numerical simulations demonstrate that compared to the full dCov or HSIC, our
variants have the same power up to a $\sqrt 2$ factor, giving practitioners a
new option for large problems or data-analysis pipelines where computation, not
sample size, could be the bottleneck.
- Abstract(参考訳): 非パラメトリック独立テストでは、i.d.\ data $\{(X_i,Y_i)\}_{i=1}^n$, where $X \in \mathcal{X}, Y \in \mathcal{Y}$が任意の一般空間に存在し、$X$が$Y$から独立であるようなnullをテストする。
カーネルHilbert-Schmidt Independence Criterion (HSIC) や Distance Covariance (dCov) のような現代のテスト統計は、基礎となるU統計の縮退により、難解なnull分布を持つ。
したがって、実際には2次時間統計(例えば、数百回)の再計算を犠牲にして、漸近的な保証を提供する置換テストを使うのが一般的である。
本稿では HSIC と dCov (xHSIC and xdCov, 発音は `cross'' の HSIC/dCov) の単純かつ非自明な修正を提供し、それらが null の下でガウス分布を制限するので、置換は不要である。
これは、Kim and Ramdas (2020) によって新たに開発されたクロスU統計学の理論に基づいて構築され、特にシェハールら(2022)におけるいくつかの非自明な拡張を開発する必要がある。
我々の新しいテストは、オリジナルのテストと同様に、固定された代替品に対して一貫しており、スムーズな局所的な代替品に対して最小値の速度が最適であることを示す。
数値シミュレーションにより、dCovやHSICと比較して、我々の変種は同じパワーを$\sqrt 2$ factorまで持つことが示され、大規模な問題やサンプルサイズではなく計算がボトルネックとなるようなデータ分析パイプラインに対する新たな選択肢が実現された。
関連論文リスト
- The Minimax Rate of HSIC Estimation for Translation-Invariant Kernels [0.0]
連続有界変換不変特性核を持つガウス環を含むボレル測度に対する$mathbb Rd$のHSIC推定の最小値が$mathcal O!left(n-1/2right)$であることを証明する。
論文 参考訳(メタデータ) (2024-03-12T15:13:21Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Differentially Private Conditional Independence Testing [35.376975903797444]
条件独立テスト(CI)は統計データ解析に広く用いられている。
本研究では,差分プライバシー制約下での条件付き独立試験について検討する。
論文 参考訳(メタデータ) (2023-06-11T16:46:00Z) - Sharp Constants in Uniformity Testing via the Huber Statistic [16.384142529375435]
一様性テスト(英: Uniformity testing)は、プロパティテストにおいて最もよく研究されている問題の1つである。
1-デルタ確率を持つ任意の$epsilon$-far分布と$m$要素上の均一分布を区別する最適なサンプル複雑性は$nであることが知られている。
衝突試験機は, 均一入力と非一様入力の分離の標準偏差数において, 急激な最大定数を達成することを示す。
論文 参考訳(メタデータ) (2022-06-21T20:43:53Z) - Exact Paired-Permutation Testing for Structured Test Statistics [67.71280539312536]
構造化されたテスト統計群のペア置換テストに対して,効率的な正確なアルゴリズムを提案する。
我々の正確なアルゴリズムはモンテカルロ近似よりも10ドル速く、共通のデータセットに20000ドルのサンプルがある。
論文 参考訳(メタデータ) (2022-05-03T11:00:59Z) - A Kernel Test for Causal Association via Noise Contrastive Backdoor Adjustment [18.791409397894835]
我々は、textitdo-null仮説である$H_0:; p(y|textit do(X=x))=p(y)$をテストする非パラメトリックな方法を開発した。
我々は,バックドアHSIC (bd-HSIC) が校正され,多数の共同設立者の下でバイナリと継続的治療を行う能力を持っていることを実証した。
論文 参考訳(メタデータ) (2021-11-25T19:12:37Z) - The Sample Complexity of Robust Covariance Testing [56.98280399449707]
i. i. d.
形式 $Z = (1-epsilon) X + epsilon B$ の分布からのサンプル。ここで $X$ はゼロ平均で未知の共分散である Gaussian $mathcalN(0, Sigma)$ である。
汚染がない場合、事前の研究は、$O(d)$サンプルを使用するこの仮説テストタスクの単純なテスターを与えた。
サンプル複雑性の上限が $omega(d2)$ for $epsilon$ an arbitrarily small constant and $gamma であることを証明します。
論文 参考訳(メタデータ) (2020-12-31T18:24:41Z) - Dimension-agnostic inference using cross U-statistics [33.17951971728784]
本稿では,サンプル分割と自己正規化とともに,既存のテスト統計の変分表現を用いた手法を提案する。
結果の統計学は、縮退したU統計を慎重に修正し、対角ブロックを落とし、対角ブロックを外したままにすると見なすことができる。
論文 参考訳(メタデータ) (2020-11-10T12:21:34Z) - Optimal Testing of Discrete Distributions with High Probability [49.19942805582874]
高確率状態に着目して離散分布を試験する問題について検討する。
一定の要素でサンプル最適である近接性および独立性テストのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-14T16:09:17Z) - Locally Private Hypothesis Selection [96.06118559817057]
我々は、$mathcalQ$から$p$までの総変動距離が最良の分布に匹敵する分布を出力する。
局所的な差分プライバシーの制約は、コストの急激な増加を引き起こすことを示す。
提案アルゴリズムは,従来手法のラウンド複雑性を指数関数的に改善する。
論文 参考訳(メタデータ) (2020-02-21T18:30:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。