論文の概要: Efficient Aggregated Kernel Tests using Incomplete $U$-statistics
- arxiv url: http://arxiv.org/abs/2206.09194v1
- Date: Sat, 18 Jun 2022 12:30:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 15:34:14.199986
- Title: Efficient Aggregated Kernel Tests using Incomplete $U$-statistics
- Title(参考訳): 不完全$U$統計を用いた効率的な凝集カーネル試験
- Authors: Antonin Schrab and Ilmun Kim and Benjamin Guedj and Arthur Gretton
- Abstract要約: 提案した3つのテストは、複数のカーネル帯域に集約され、さまざまなスケールでnullからの離脱を検出する。
提案した線形時間集約テストは,現在最先端の線形時間カーネルテストよりも高い出力が得られることを示す。
- 参考スコア(独自算出の注目度): 22.251118308736327
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose a series of computationally efficient, nonparametric tests for the
two-sample, independence and goodness-of-fit problems, using the Maximum Mean
Discrepancy (MMD), Hilbert Schmidt Independence Criterion (HSIC), and Kernel
Stein Discrepancy (KSD), respectively. Our test statistics are incomplete
$U$-statistics, with a computational cost that interpolates between linear time
in the number of samples, and quadratic time, as associated with classical
$U$-statistic tests. The three proposed tests aggregate over several kernel
bandwidths to detect departures from the null on various scales: we call the
resulting tests MMDAggInc, HSICAggInc and KSDAggInc. For the test thresholds,
we derive a quantile bound for wild bootstrapped incomplete $U$- statistics,
which is of independent interest. We derive uniform separation rates for
MMDAggInc and HSICAggInc, and quantify exactly the trade-off between
computational efficiency and the attainable rates: this result is novel for
tests based on incomplete $U$-statistics, to our knowledge. We further show
that in the quadratic-time case, the wild bootstrap incurs no penalty to test
power over more widespread permutation-based approaches, since both attain the
same minimax optimal rates (which in turn match the rates that use oracle
quantiles). We support our claims with numerical experiments on the trade-off
between computational efficiency and test power. In the three testing
frameworks, we observe that our proposed linear-time aggregated tests obtain
higher power than current state-of-the-art linear-time kernel tests.
- Abstract(参考訳): 本稿では,Hilbert Schmidt Independence Criterion (HSIC) と Kernel Stein Discrepancy (KSD) を用いて,2サンプル・独立性・適合性問題に対する計算効率の良い非パラメトリックテストを提案する。
我々のテスト統計は、古典的な$U$-statisticsと関連する、サンプル数における線形時間と二次時間の間に補間する計算コストを持つ不完全$U$-statisticsである。
提案した3つのテストは、複数のカーネル帯域にまたがって集約され、さまざまなスケールでnullからの離脱を検出する: MMDAggInc、HSICAggInc、KSDAggInc。
テストしきい値については、独立利害関係にあるワイルドブートストラップの不完全な$u$-統計値のクォンティルバウンドを導出する。
我々はMMDAggIncとHSICAggIncの均一分離率を導出し、計算効率と達成可能な速度とのトレードオフを正確に定量化する。
さらに、二次時間の場合、ワイルドブートストラップは、同じミニマックス最適レート(oracle quantilesを使用するレートに一致する)を達成するため、より広範な置換ベースのアプローチでパワーをテストするためのペナルティを負わないことも示します。
計算効率とテストパワーのトレードオフに関する数値実験により,我々の主張を支持する。
3つのテストフレームワークにおいて,提案する線形時間集約テストは,現行の線形時間カーネルテストよりも高いパワーを得られることを確認した。
関連論文リスト
- Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - A Specialized Semismooth Newton Method for Kernel-Based Optimal
Transport [92.96250725599958]
カーネルベース最適輸送(OT)推定器は、サンプルからOT問題に対処するための代替的機能的推定手順を提供する。
SSN法は, 標準正規性条件下でのグローバル収束率$O (1/sqrtk)$, 局所二次収束率を達成できることを示す。
論文 参考訳(メタデータ) (2023-10-21T18:48:45Z) - Boosting the Power of Kernel Two-Sample Tests [4.07125466598411]
最大平均誤差(MMD)に基づくカーネル2サンプルテストは、一般的な距離空間上の2つの分布の違いを検出する最も一般的な方法の1つである。
マハラノビス距離を用いて,複数のカーネル上でMDD推定値を組み合わせることで,カーネルテストのパワーを高める手法を提案する。
論文 参考訳(メタデータ) (2023-02-21T14:14:30Z) - Compress Then Test: Powerful Kernel Testing in Near-linear Time [27.723775378945643]
カーネルの2サンプルテストは、$n$のサンプルポイントに基づいたディストリビューションのペアを識別するための強力なフレームワークを提供する。
我々は,サンプル圧縮に基づく高性能カーネルテストのための新しいフレームワークであるCompress Then Test (CTT)を紹介する。
CTTは、各$n$の点サンプルを小さいが証明可能な高忠実度コアセットに圧縮することで、高価な試験を安価に近似する。
論文 参考訳(メタデータ) (2023-01-14T21:02:58Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - A Permutation-free Kernel Two-Sample Test [36.50719125230106]
サンプル分割と学生化に基づく2次時間MDDテスト統計法を提案する。
大きなサンプルサイズの場合、我々の新しいクロスMMDはMDDよりも大幅にスピードアップし、わずかに電力を消費するだけである。
論文 参考訳(メタデータ) (2022-11-27T18:15:52Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - KSD Aggregated Goodness-of-fit Test [38.45086141837479]
我々は、異なるカーネルで複数のテストを集約するKSDAggと呼ばれるテストを構築する戦略を導入する。
我々は、KSDAggのパワーに関する漸近的でない保証を提供する。
KSDAggは、他の最先端のKSDベースの適合性試験方法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-02-02T00:33:09Z) - Computationally efficient sparse clustering [67.95910835079825]
我々はPCAに基づく新しいクラスタリングアルゴリズムの有限サンプル解析を行う。
ここでは,ミニマックス最適誤クラスタ化率を,体制$|theta infty$で達成することを示す。
論文 参考訳(メタデータ) (2020-05-21T17:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。