論文の概要: USP: an independence test that improves on Pearson's chi-squared and the
$G$-test
- arxiv url: http://arxiv.org/abs/2101.10880v1
- Date: Tue, 26 Jan 2021 15:42:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 19:35:35.775811
- Title: USP: an independence test that improves on Pearson's chi-squared and the
$G$-test
- Title(参考訳): usp:pearsonのchi-squaredと$g$-testを改良した独立テスト
- Authors: Thomas B. Berrett and Richard J. Samworth
- Abstract要約: U$-Statistic Permutation (USP) の独立性テストを、連続表に表示された離散データのコンテキストで提示する。
対照的に、USPテストはすべてのサンプルサイズのためのわずかなレベルでテストのサイズを制御するために保証されます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the $U$-Statistic Permutation (USP) test of independence in the
context of discrete data displayed in a contingency table. Either Pearson's
chi-squared test of independence, or the $G$-test, are typically used for this
task, but we argue that these tests have serious deficiencies, both in terms of
their inability to control the size of the test, and their power properties. By
contrast, the USP test is guaranteed to control the size of the test at the
nominal level for all sample sizes, has no issues with small (or zero) cell
counts, and is able to detect distributions that violate independence in only a
minimal way. The test statistic is derived from a $U$-statistic estimator of a
natural population measure of dependence, and we prove that this is the unique
minimum variance unbiased estimator of this population quantity. The practical
utility of the USP test is demonstrated on both simulated data, where its power
can be dramatically greater than those of Pearson's test and the $G$-test, and
on real data. The USP test is implemented in the R package USP.
- Abstract(参考訳): U$-Statistic Permutation (USP) の独立性テストを、連続表に表示された離散データのコンテキストで提示する。
ピアソンの2乗独立テスト(または$G$-test)は一般的にこのタスクに使用されるが、これらのテストはテストのサイズやパワー特性を制御できないという点で、深刻な欠陥があると主張する。
対照的にUSPテストでは、すべてのサンプルサイズに対して名目レベルでテストのサイズを制御することが保証されており、小さな(またはゼロの)細胞数に問題はなく、最小限の方法で独立性に反する分布を検出することができる。
テスト統計は、依存の自然な人口尺度の$ U$統計的推定値から派生しており、これはこの人口量のユニークな最小分散不偏推定値であることを証明します。
USP テストの実用性は、Pearson のテストや $G$-test のそれよりも劇的に大きなパワーを持つシミュレートされたデータと、実際のデータの両方で実証されています。
USPテストは、RパッケージUSPで実装される。
関連論文リスト
- Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - An $\ell^p$-based Kernel Conditional Independence Test [21.689461247198388]
そこで本稿では, 最適分布の2つのカーネルベース代表者間の距離を$Lp$とする, 条件付き独立性のための計算効率の高い新しいテストを提案する。
我々は,新しい試験の性能が,高次元設定においても,統計的パワーとタイプI誤差の両方の観点から,最先端の手法よりも優れていることを示す一連の実験を行った。
論文 参考訳(メタデータ) (2021-10-28T03:18:27Z) - The power of private likelihood-ratio tests for goodness-of-fit in
frequency tables [1.713291434132985]
周波数表の適合性に関するプライバシー保護テストについて検討する。
本研究は,検査の統計的意義の喪失を避けるため,摂動を考慮に入れることの重要性を示す。
本研究は,プライバシ保護型LRテストにおいて,周波数表に適合性を示すための厳格な治療法として初めて提示するものである。
論文 参考訳(メタデータ) (2021-09-20T15:30:42Z) - Optimal Testing of Discrete Distributions with High Probability [49.19942805582874]
高確率状態に着目して離散分布を試験する問題について検討する。
一定の要素でサンプル最適である近接性および独立性テストのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-14T16:09:17Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z) - Optimal rates for independence testing via $U$-statistic permutation
tests [7.090165638014331]
独立分布と同一分布のペアが$sigma$-finiteで分離可能な測度空間で値を取る独立性テストの問題について検討する。
最初に、独立性の有効なテストはなく、$f: D(f) geq rho2 $ という形の代替と一様に一致していることを示す。
論文 参考訳(メタデータ) (2020-01-15T19:04:23Z) - The Chi-Square Test of Distance Correlation [7.748852202364896]
チ二乗検定は非パラメトリックであり、非常に高速であり、強い負のタイプ計量または特徴核を用いてバイアス補正された距離相関に適用できる。
基礎となるカイ二乗分布は上尾部の制限零分布をよく近似し支配しており、カイ二乗試験が独立性テストに有効で一貫性があることを証明している。
論文 参考訳(メタデータ) (2019-12-27T15:16:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。