論文の概要: Compress Then Test: Powerful Kernel Testing in Near-linear Time
- arxiv url: http://arxiv.org/abs/2301.05974v1
- Date: Sat, 14 Jan 2023 21:02:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 17:56:07.727180
- Title: Compress Then Test: Powerful Kernel Testing in Near-linear Time
- Title(参考訳): Compressがテスト中: ほぼ直線で強力なカーネルテスト
- Authors: Carles Domingo-Enrich, Raaz Dwivedi, Lester Mackey
- Abstract要約: カーネルの2サンプルテストは、$n$のサンプルポイントに基づいたディストリビューションのペアを識別するための強力なフレームワークを提供する。
我々は,サンプル圧縮に基づく高性能カーネルテストのための新しいフレームワークであるCompress Then Test (CTT)を紹介する。
CTTは、各$n$の点サンプルを小さいが証明可能な高忠実度コアセットに圧縮することで、高価な試験を安価に近似する。
- 参考スコア(独自算出の注目度): 27.723775378945643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Kernel two-sample testing provides a powerful framework for distinguishing
any pair of distributions based on $n$ sample points. However, existing kernel
tests either run in $n^2$ time or sacrifice undue power to improve runtime. To
address these shortcomings, we introduce Compress Then Test (CTT), a new
framework for high-powered kernel testing based on sample compression. CTT
cheaply approximates an expensive test by compressing each $n$ point sample
into a small but provably high-fidelity coreset. For standard kernels and
subexponential distributions, CTT inherits the statistical behavior of a
quadratic-time test -- recovering the same optimal detection boundary -- while
running in near-linear time. We couple these advances with cheaper permutation
testing, justified by new power analyses; improved time-vs.-quality guarantees
for low-rank approximation; and a fast aggregation procedure for identifying
especially discriminating kernels. In our experiments with real and simulated
data, CTT and its extensions provide 20--200x speed-ups over state-of-the-art
approximate MMD tests with no loss of power.
- Abstract(参考訳): カーネルの2サンプルテストは、$n$のサンプルポイントに基づいたディストリビューションのペアを識別するための強力なフレームワークを提供する。
しかし、既存のカーネルテストは、$n^2$の時間で実行されるか、実行時を改善するために未処理のパワーを犠牲にする。
これらの欠点に対処するために,サンプル圧縮に基づく高性能カーネルテストのための新しいフレームワークであるCompress Then Test (CTT)を紹介する。
CTTは、各$n$の点サンプルを小さいが証明可能な高忠実度コアセットに圧縮することで、高価な試験を安価に近似する。
標準的なカーネルやサブ指数分布では、CTTは2次時間テスト(同じ最適検出境界を回復する)の統計的挙動をほぼ直線時間で実行しながら継承する。
我々はこれらの進歩を、新しい電力分析によって正当化され、より安価な置換試験に結びつけ、時間-vsを改善した。
-低ランク近似に対する品質保証、特に識別するカーネルを特定するための高速な集約手順。
実データおよびシミュレーションデータを用いた実験では、CTTとその拡張は、出力損失のない最先端の近似MDDテストよりも20-200倍のスピードアップを提供する。
関連論文リスト
- Robust Kernel Hypothesis Testing under Data Corruption [6.430258446597413]
データ破損下での頑健な置換テストを構築するための2つの一般的な方法を提案する。
最小限の条件下での力の一貫性を証明する。
これは、潜在的な敵攻撃を伴う現実世界のアプリケーションに対する仮説テストの実践的な展開に寄与する。
論文 参考訳(メタデータ) (2024-05-30T10:23:16Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Efficient Aggregated Kernel Tests using Incomplete $U$-statistics [22.251118308736327]
提案した3つのテストは、複数のカーネル帯域に集約され、さまざまなスケールでnullからの離脱を検出する。
提案した線形時間集約テストは,現在最先端の線形時間カーネルテストよりも高い出力が得られることを示す。
論文 参考訳(メタデータ) (2022-06-18T12:30:06Z) - Exact Paired-Permutation Testing for Structured Test Statistics [67.71280539312536]
構造化されたテスト統計群のペア置換テストに対して,効率的な正確なアルゴリズムを提案する。
我々の正確なアルゴリズムはモンテカルロ近似よりも10ドル速く、共通のデータセットに20000ドルのサンプルがある。
論文 参考訳(メタデータ) (2022-05-03T11:00:59Z) - An Optimal Witness Function for Two-Sample Testing [13.159512679346685]
証人2サンプルテスト(WiTS)と呼ばれる1次元証人関数に基づくデータ依存テスト統計法を提案する。
特性カーネルに基づく WiTS テストは,任意の固定された代替品に対して一貫したものであることを示す。
論文 参考訳(メタデータ) (2021-02-10T17:13:21Z) - Optimal Testing of Discrete Distributions with High Probability [49.19942805582874]
高確率状態に着目して離散分布を試験する問題について検討する。
一定の要素でサンプル最適である近接性および独立性テストのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-14T16:09:17Z) - Learning Kernel Tests Without Data Splitting [18.603394415852765]
データ分割なしにハイパーパラメータの学習と全サンプルでのテストを可能にするアプローチを提案する。
我々のアプローチの試験能力は、その分割割合に関係なく、データ分割アプローチよりも経験的に大きい。
論文 参考訳(メタデータ) (2020-06-03T14:07:39Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z) - Learning Deep Kernels for Non-Parametric Two-Sample Tests [50.92621794426821]
2組のサンプルが同じ分布から引き出されるかどうかを判定するカーネルベースの2サンプルテストのクラスを提案する。
私たちのテストは、テストパワーを最大化するためにトレーニングされたディープニューラルネットワークによってパラメータ化されたカーネルから構築されます。
論文 参考訳(メタデータ) (2020-02-21T03:54:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。