論文の概要: High-dimensional and universally consistent k-sample tests
- arxiv url: http://arxiv.org/abs/1910.08883v4
- Date: Wed, 11 Oct 2023 17:14:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 17:48:44.828110
- Title: High-dimensional and universally consistent k-sample tests
- Title(参考訳): 高次元および普遍的一貫したkサンプル試験
- Authors: Sambit Panda, Cencheng Shen, Ronan Perry, Jelle Zorn, Antoine Lutz,
Carey E. Priebe, Joshua T. Vogelstein
- Abstract要約: kサンプルテスト問題は、同じ分布からそれぞれ$k$のデータポイントのグループが引き出されるかどうかを決定することである。
独立テストは、普遍的に一貫したkサンプルテストを達成する。
- 参考スコア(独自算出の注目度): 18.327837489069907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The k-sample testing problem involves determining whether $k$ groups of data
points are each drawn from the same distribution. The standard method for
k-sample testing in biomedicine is Multivariate analysis of variance (MANOVA),
despite that it depends on strong, and often unsuitable, parametric
assumptions. Moreover, independence testing and k-sample testing are closely
related, and several universally consistent high-dimensional independence tests
such as distance correlation (Dcorr) and Hilbert-Schmidt-Independence-Criterion
(Hsic) enjoy solid theoretical and empirical properties. In this paper, we
prove that independence tests achieve universally consistent k-sample testing
and that k-sample statistics such as Energy and Maximum Mean Discrepancy (MMD)
are precisely equivalent to Dcorr. An empirical evaluation of nonparametric
independence tests showed that they generally perform better than the popular
MANOVA test, even in Gaussian distributed scenarios. The evaluation included
several popular independence statistics and covered a comprehensive set of
simulations. Additionally, the testing approach was extended to perform
multiway and multilevel tests, which were demonstrated in a simulated study as
well as a real-world fMRI brain scans with a set of attributes.
- Abstract(参考訳): kサンプルテスト問題は、同じ分布からそれぞれ$k$のデータポイントのグループが引き出されるかどうかを決定することである。
生体医学におけるk-サンプルテストの標準的な方法は多変量分散分析(manova)である。
さらに、独立性テストとk-サンプルテストは密接な関係にあり、距離相関(dcorr)やヒルベルト・シュミット独立性基準(hsic)のような普遍的に一貫した高次元独立性テストは、理論的および経験的性質を享受している。
本稿では,独立テストが一貫したkサンプルテストを実現し,エネルギーや最大平均離散性(MMD)などのkサンプル統計値がDcorrと同値であることを証明する。
非パラメトリック独立試験の実験的評価により、ガウス分布シナリオにおいても、一般的なMANOVA試験よりも一般的に優れた性能を示した。
評価にはいくつかの人気のある独立統計が含まれ、総合的なシミュレーションを扱った。
さらに、テストアプローチはマルチウェイおよびマルチレベルテストの実行に拡張され、シミュレーションされた研究や、属性セットの実際のfMRI脳スキャンで実証された。
関連論文リスト
- Testing multivariate normality by testing independence [0.0]
本稿では,Kac-Bernsteinの特性に基づく簡易な多変量正規化テストを提案する。
また,高次元データに対して,提案手法は代替手法よりも効率的である可能性が示唆された。
論文 参考訳(メタデータ) (2023-11-20T07:19:52Z) - Conditional Independence Testing with Heteroskedastic Data and
Applications to Causal Discovery [7.493779672689531]
条件独立テスト(CI)は、様々な科学分野のデータ分析や機械学習に頻繁に用いられる。
ヘテロスケダスト性雑音の存在下でよく機能する部分相関型CIテストの適応について述べる。
数値因果探索実験により、適応された部分相関CIテストはヘテロスケダスティック性の存在下で標準試験より優れることが示された。
論文 参考訳(メタデータ) (2023-06-20T12:36:38Z) - Detecting Adversarial Data by Probing Multiple Perturbations Using
Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。
本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。
EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文 参考訳(メタデータ) (2023-05-25T13:14:58Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Cross-validation Confidence Intervals for Test Error [83.67415139421448]
この研究は、クロスバリデーションのための中心極限定理と、学習アルゴリズムの弱い安定性条件下での分散の一貫した推定器を開発する。
結果は、一般的な1対1のクロスバリデーションの選択にとって、初めてのものだ。
論文 参考訳(メタデータ) (2020-07-24T17:40:06Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z) - Learning Kernel Tests Without Data Splitting [18.603394415852765]
データ分割なしにハイパーパラメータの学習と全サンプルでのテストを可能にするアプローチを提案する。
我々のアプローチの試験能力は、その分割割合に関係なく、データ分割アプローチよりも経験的に大きい。
論文 参考訳(メタデータ) (2020-06-03T14:07:39Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z) - High-Dimensional Independence Testing via Maximum and Average Distance
Correlations [5.756296617325109]
辺依存性次元の数に関して,高次元設定における一貫性特性を特徴付ける。
本稿では,各テスト統計の利点を検証し,それぞれのヌル分布を検証し,高速なチ二乗検定手法を提案する。
論文 参考訳(メタデータ) (2020-01-04T16:21:50Z) - The Chi-Square Test of Distance Correlation [7.748852202364896]
チ二乗検定は非パラメトリックであり、非常に高速であり、強い負のタイプ計量または特徴核を用いてバイアス補正された距離相関に適用できる。
基礎となるカイ二乗分布は上尾部の制限零分布をよく近似し支配しており、カイ二乗試験が独立性テストに有効で一貫性があることを証明している。
論文 参考訳(メタデータ) (2019-12-27T15:16:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。