論文の概要: The Chi-Square Test of Distance Correlation
- arxiv url: http://arxiv.org/abs/1912.12150v5
- Date: Fri, 14 May 2021 18:09:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 23:37:45.697647
- Title: The Chi-Square Test of Distance Correlation
- Title(参考訳): Chi-Squareによる距離相関試験
- Authors: Cencheng Shen, Sambit Panda, Joshua T. Vogelstein
- Abstract要約: チ二乗検定は非パラメトリックであり、非常に高速であり、強い負のタイプ計量または特徴核を用いてバイアス補正された距離相関に適用できる。
基礎となるカイ二乗分布は上尾部の制限零分布をよく近似し支配しており、カイ二乗試験が独立性テストに有効で一貫性があることを証明している。
- 参考スコア(独自算出の注目度): 7.748852202364896
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distance correlation has gained much recent attention in the data science
community: the sample statistic is straightforward to compute and
asymptotically equals zero if and only if independence, making it an ideal
choice to discover any type of dependency structure given sufficient sample
size. One major bottleneck is the testing process: because the null
distribution of distance correlation depends on the underlying random variables
and metric choice, it typically requires a permutation test to estimate the
null and compute the p-value, which is very costly for large amount of data. To
overcome the difficulty, in this paper we propose a chi-square test for
distance correlation. Method-wise, the chi-square test is non-parametric,
extremely fast, and applicable to bias-corrected distance correlation using any
strong negative type metric or characteristic kernel. The test exhibits a
similar testing power as the standard permutation test, and can be utilized for
K-sample and partial testing. Theory-wise, we show that the underlying
chi-square distribution well approximates and dominates the limiting null
distribution in upper tail, prove the chi-square test can be valid and
universally consistent for testing independence, and establish a testing power
inequality with respect to the permutation test.
- Abstract(参考訳): サンプル統計は計算が容易であり、漸近的に 0 に等しいのは独立性があるときと独立性があるときのみであり、十分なサンプルサイズを持つ任意の種類の依存構造を発見するのに理想的な選択である。
距離相関のヌル分布は、基礎となる確率変数と計量選択に依存するため、通常、ヌルを推定し、大量のデータに対して非常にコストがかかるp値を計算するために、置換テストが必要となる。
難易度を克服するため,本稿では距離相関のためのchi-squareテストを提案する。
方法的には、chi-square testは非パラメトリックであり、非常に高速であり、いかなる強い負の型メトリックや特性カーネルを用いてバイアス補正された距離相関に適用できる。
この試験は標準置換試験と同様のテスト能力を示し、Kサンプルと部分試験に使用できる。
理論的には、基礎となるカイ二乗分布が上尾部の制限ヌル分布をよく近似し支配し、チ二乗テストが独立性テストにおいて有効かつ普遍的に整合であることを示し、置換テストに関してテストパワーの不等式を確立する。
関連論文リスト
- An Efficient Permutation-Based Kernel Two-Sample Test [12.331562761756679]
2サンプル仮説テストは統計学と機械学習の基本的な問題である。
本研究では,最大平均誤差(MMD)のNystr "om approxation"を用いて,計算効率よく実用的なテストアルゴリズムを設計する。
論文 参考訳(メタデータ) (2025-02-19T09:22:48Z) - Revisiting the Dataset Bias Problem from a Statistical Perspective [72.94990819287551]
統計的観点から「データセットバイアス」問題を考察する。
問題の主な原因は、クラス属性 u と非クラス属性 b の強い相関関係である。
本稿では,各試料nの目的をフラクタル1p(u_n|b_n)で重み付けするか,その試料をフラクタル1p(u_n|b_n)に比例してサンプリングすることにより,データセットバイアスを軽減することを提案する。
論文 参考訳(メタデータ) (2024-02-05T22:58:06Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Universal Inference Meets Random Projections: A Scalable Test for Log-concavity [30.073886309373226]
任意の次元の有限標本で証明可能な対数凹凸の最初のテストを示す。
D次元試験問題を多くの一次元問題に変換するランダム・プロジェクション・アプローチは高出力が得られる。
論文 参考訳(メタデータ) (2021-11-17T17:34:44Z) - Optimal Testing of Discrete Distributions with High Probability [49.19942805582874]
高確率状態に着目して離散分布を試験する問題について検討する。
一定の要素でサンプル最適である近接性および独立性テストのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-14T16:09:17Z) - Cross-validation Confidence Intervals for Test Error [83.67415139421448]
この研究は、クロスバリデーションのための中心極限定理と、学習アルゴリズムの弱い安定性条件下での分散の一貫した推定器を開発する。
結果は、一般的な1対1のクロスバリデーションの選択にとって、初めてのものだ。
論文 参考訳(メタデータ) (2020-07-24T17:40:06Z) - High-Dimensional Independence Testing via Maximum and Average Distance
Correlations [5.756296617325109]
辺依存性次元の数に関して,高次元設定における一貫性特性を特徴付ける。
本稿では,各テスト統計の利点を検証し,それぞれのヌル分布を検証し,高速なチ二乗検定手法を提案する。
論文 参考訳(メタデータ) (2020-01-04T16:21:50Z) - Asymptotic Validity and Finite-Sample Properties of Approximate Randomization Tests [2.28438857884398]
我々の理論的な重要な貢献は、ノイズレスデータを用いた近似ランダム化テストのサイズと元のランダム化テストのサイズとの差に非漸近的境界を持つことである。
線形回帰における有意性のテストを含むいくつかの例を通して、我々の理論を解説する。
論文 参考訳(メタデータ) (2019-08-12T16:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。