論文の概要: High-dimensional and universally consistent k-sample tests
- arxiv url: http://arxiv.org/abs/1910.08883v4
- Date: Wed, 11 Oct 2023 17:14:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 17:48:44.828110
- Title: High-dimensional and universally consistent k-sample tests
- Title(参考訳): 高次元および普遍的一貫したkサンプル試験
- Authors: Sambit Panda, Cencheng Shen, Ronan Perry, Jelle Zorn, Antoine Lutz,
Carey E. Priebe, Joshua T. Vogelstein
- Abstract要約: kサンプルテスト問題は、同じ分布からそれぞれ$k$のデータポイントのグループが引き出されるかどうかを決定することである。
独立テストは、普遍的に一貫したkサンプルテストを達成する。
- 参考スコア(独自算出の注目度): 18.327837489069907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The k-sample testing problem involves determining whether $k$ groups of data
points are each drawn from the same distribution. The standard method for
k-sample testing in biomedicine is Multivariate analysis of variance (MANOVA),
despite that it depends on strong, and often unsuitable, parametric
assumptions. Moreover, independence testing and k-sample testing are closely
related, and several universally consistent high-dimensional independence tests
such as distance correlation (Dcorr) and Hilbert-Schmidt-Independence-Criterion
(Hsic) enjoy solid theoretical and empirical properties. In this paper, we
prove that independence tests achieve universally consistent k-sample testing
and that k-sample statistics such as Energy and Maximum Mean Discrepancy (MMD)
are precisely equivalent to Dcorr. An empirical evaluation of nonparametric
independence tests showed that they generally perform better than the popular
MANOVA test, even in Gaussian distributed scenarios. The evaluation included
several popular independence statistics and covered a comprehensive set of
simulations. Additionally, the testing approach was extended to perform
multiway and multilevel tests, which were demonstrated in a simulated study as
well as a real-world fMRI brain scans with a set of attributes.
- Abstract(参考訳): kサンプルテスト問題は、同じ分布からそれぞれ$k$のデータポイントのグループが引き出されるかどうかを決定することである。
生体医学におけるk-サンプルテストの標準的な方法は多変量分散分析(manova)である。
さらに、独立性テストとk-サンプルテストは密接な関係にあり、距離相関(dcorr)やヒルベルト・シュミット独立性基準(hsic)のような普遍的に一貫した高次元独立性テストは、理論的および経験的性質を享受している。
本稿では,独立テストが一貫したkサンプルテストを実現し,エネルギーや最大平均離散性(MMD)などのkサンプル統計値がDcorrと同値であることを証明する。
非パラメトリック独立試験の実験的評価により、ガウス分布シナリオにおいても、一般的なMANOVA試験よりも一般的に優れた性能を示した。
評価にはいくつかの人気のある独立統計が含まれ、総合的なシミュレーションを扱った。
さらに、テストアプローチはマルチウェイおよびマルチレベルテストの実行に拡張され、シミュレーションされた研究や、属性セットの実際のfMRI脳スキャンで実証された。
関連論文リスト
- On uniqueness of the set of k-means [0.5735035463793009]
非特異性の設定に適応した経験的k平均の整合性を評価する。
k-平均集合の特異性に対するブートストラップ試験を導出する。
結果は、異なる種類の非特異性の例で示される。
論文 参考訳(メタデータ) (2024-10-17T12:40:56Z) - Detecting Adversarial Data by Probing Multiple Perturbations Using
Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。
本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。
EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文 参考訳(メタデータ) (2023-05-25T13:14:58Z) - Using Perturbation to Improve Goodness-of-Fit Tests based on Kernelized
Stein Discrepancy [3.78967502155084]
Kernelized Stein discrepancy (KSD) は、良質なテストで広く使われているスコアベースの不一致である。
我々は、KSD試験が、ターゲットと代替分布が同一の分離モードを持つが混合比が異なる場合、低出力に悩まされることを理論的かつ実証的に示す。
論文 参考訳(メタデータ) (2023-04-28T11:13:18Z) - Targeted Separation and Convergence with Kernel Discrepancies [61.973643031360254]
カーネルベースの不一致測度は、(i)ターゲットPを他の確率測度から分離するか、(ii)Pへの弱収束を制御する必要がある。
本稿では, (i) と (ii) を保証するのに十分な,必要な新しい条件を導出する。
可分距離空間上のMDDに対して、ボヒナー埋め込み可測度を分離するカーネルを特徴づけ、すべての測度を非有界カーネルと分離するための単純な条件を導入する。
論文 参考訳(メタデータ) (2022-09-26T16:41:16Z) - Predicting Out-of-Domain Generalization with Neighborhood Invariance [59.05399533508682]
局所変換近傍における分類器の出力不変性の尺度を提案する。
私たちの測度は計算が簡単で、テストポイントの真のラベルに依存しません。
画像分類,感情分析,自然言語推論のベンチマーク実験において,我々の測定値と実際のOOD一般化との間に強い相関関係を示す。
論文 参考訳(メタデータ) (2022-07-05T14:55:16Z) - Selective inference for k-means clustering [0.0]
k平均クラスタリングを用いて得られた一対のクラスタ間の差分に対する選択型I誤差を制御する有限サンプルp値を提案する。
提案手法をシミュレーションや手書き桁データ,シングルセルRNAシークエンシングデータに適用する。
論文 参考訳(メタデータ) (2022-03-29T06:28:12Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Calibration of Neural Networks using Splines [51.42640515410253]
キャリブレーション誤差の測定は、2つの経験的分布を比較します。
古典的コルモゴロフ・スミルノフ統計テスト(KS)にインスパイアされたビンニングフリーキャリブレーション尺度を導入する。
提案手法は,KS誤差に対する既存の手法と,他の一般的なキャリブレーション手法とを一貫して比較する。
論文 参考訳(メタデータ) (2020-06-23T07:18:05Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - High-Dimensional Independence Testing via Maximum and Average Distance
Correlations [5.756296617325109]
辺依存性次元の数に関して,高次元設定における一貫性特性を特徴付ける。
本稿では,各テスト統計の利点を検証し,それぞれのヌル分布を検証し,高速なチ二乗検定手法を提案する。
論文 参考訳(メタデータ) (2020-01-04T16:21:50Z) - The Chi-Square Test of Distance Correlation [7.748852202364896]
チ二乗検定は非パラメトリックであり、非常に高速であり、強い負のタイプ計量または特徴核を用いてバイアス補正された距離相関に適用できる。
基礎となるカイ二乗分布は上尾部の制限零分布をよく近似し支配しており、カイ二乗試験が独立性テストに有効で一貫性があることを証明している。
論文 参考訳(メタデータ) (2019-12-27T15:16:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。