Fugu-MT 論文翻訳(概要): High-dimensional and universally consistent k-sample tests

論文の概要: High-dimensional and universally consistent k-sample tests

arxiv url: http://arxiv.org/abs/1910.08883v4
Date: Wed, 11 Oct 2023 17:14:41 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-13 17:48:44.828110
Title: High-dimensional and universally consistent k-sample tests
Title（参考訳）: 高次元および普遍的一貫したkサンプル試験
Authors: Sambit Panda, Cencheng Shen, Ronan Perry, Jelle Zorn, Antoine Lutz, Carey E. Priebe, Joshua T. Vogelstein
Abstract要約: kサンプルテスト問題は、同じ分布からそれぞれ$k$のデータポイントのグループが引き出されるかどうかを決定することである。独立テストは、普遍的に一貫したkサンプルテストを達成する。
参考スコア（独自算出の注目度）: 18.327837489069907
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The k-sample testing problem involves determining whether $k$ groups of data points are each drawn from the same distribution. The standard method for k-sample testing in biomedicine is Multivariate analysis of variance (MANOVA), despite that it depends on strong, and often unsuitable, parametric assumptions. Moreover, independence testing and k-sample testing are closely related, and several universally consistent high-dimensional independence tests such as distance correlation (Dcorr) and Hilbert-Schmidt-Independence-Criterion (Hsic) enjoy solid theoretical and empirical properties. In this paper, we prove that independence tests achieve universally consistent k-sample testing and that k-sample statistics such as Energy and Maximum Mean Discrepancy (MMD) are precisely equivalent to Dcorr. An empirical evaluation of nonparametric independence tests showed that they generally perform better than the popular MANOVA test, even in Gaussian distributed scenarios. The evaluation included several popular independence statistics and covered a comprehensive set of simulations. Additionally, the testing approach was extended to perform multiway and multilevel tests, which were demonstrated in a simulated study as well as a real-world fMRI brain scans with a set of attributes.
Abstract（参考訳）: kサンプルテスト問題は、同じ分布からそれぞれ$k$のデータポイントのグループが引き出されるかどうかを決定することである。生体医学におけるk-サンプルテストの標準的な方法は多変量分散分析(manova)である。さらに、独立性テストとk-サンプルテストは密接な関係にあり、距離相関(dcorr)やヒルベルト・シュミット独立性基準(hsic)のような普遍的に一貫した高次元独立性テストは、理論的および経験的性質を享受している。本稿では,独立テストが一貫したkサンプルテストを実現し,エネルギーや最大平均離散性(MMD)などのkサンプル統計値がDcorrと同値であることを証明する。非パラメトリック独立試験の実験的評価により、ガウス分布シナリオにおいても、一般的なMANOVA試験よりも一般的に優れた性能を示した。評価にはいくつかの人気のある独立統計が含まれ、総合的なシミュレーションを扱った。さらに、テストアプローチはマルチウェイおよびマルチレベルテストの実行に拡張され、シミュレーションされた研究や、属性セットの実際のfMRI脳スキャンで実証された。

関連論文リスト

A Sample Efficient Conditional Independence Test in the Presence of Discretization [54.047334792855345]
離散化されたデータに直接条件付き独立テスト(CI)は、誤った結論につながる可能性がある。最近の進歩は、観測データをバイナライズすることで、潜伏変数間の適切なCI関係を推測することを目指している。そこで本研究では,バイナライゼーションプロセスに依存しないサンプル効率のCIテストを提案する。
論文参考訳（メタデータ） (2025-06-10T12:41:26Z)
Statistical Verification of Linear Classifiers [76.95660509846216]
本研究では,2つの試料間の線形分離性の概念に密接に関連する均一性試験を提案する。本研究では,2次元試料に適用した場合に,テストのEmphp値の上限値の設定に焦点をあてる。
論文参考訳（メタデータ） (2025-01-24T11:56:45Z)
On uniqueness of the set of k-means [0.5735035463793009]
非特異性の設定に適応した経験的k平均の整合性を評価する。 k-平均集合の特異性に対するブートストラップ試験を導出する。結果は、異なる種類の非特異性の例で示される。
論文参考訳（メタデータ） (2024-10-17T12:40:56Z)
Detecting Adversarial Data by Probing Multiple Perturbations Using Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。 EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文参考訳（メタデータ） (2023-05-25T13:14:58Z)
Using Perturbation to Improve Goodness-of-Fit Tests based on Kernelized Stein Discrepancy [3.78967502155084]
Kernelized Stein discrepancy (KSD) は、良質なテストで広く使われているスコアベースの不一致である。我々は、KSD試験が、ターゲットと代替分布が同一の分離モードを持つが混合比が異なる場合、低出力に悩まされることを理論的かつ実証的に示す。
論文参考訳（メタデータ） (2023-04-28T11:13:18Z)
Targeted Separation and Convergence with Kernel Discrepancies [61.973643031360254]
カーネルベースの不一致測度は、(i)ターゲットPを他の確率測度から分離するか、(ii)Pへの弱収束を制御する必要がある。本稿では, (i) と (ii) を保証するのに十分な,必要な新しい条件を導出する。可分距離空間上のMDDに対して、ボヒナー埋め込み可測度を分離するカーネルを特徴づけ、すべての測度を非有界カーネルと分離するための単純な条件を導入する。
論文参考訳（メタデータ） (2022-09-26T16:41:16Z)
Predicting Out-of-Domain Generalization with Neighborhood Invariance [59.05399533508682]
局所変換近傍における分類器の出力不変性の尺度を提案する。私たちの測度は計算が簡単で、テストポイントの真のラベルに依存しません。画像分類,感情分析,自然言語推論のベンチマーク実験において,我々の測定値と実際のOOD一般化との間に強い相関関係を示す。
論文参考訳（メタデータ） (2022-07-05T14:55:16Z)
Selective inference for k-means clustering [0.0]
k平均クラスタリングを用いて得られた一対のクラスタ間の差分に対する選択型I誤差を制御する有限サンプルp値を提案する。提案手法をシミュレーションや手書き桁データ,シングルセルRNAシークエンシングデータに適用する。
論文参考訳（メタデータ） (2022-03-29T06:28:12Z)
Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。条件付き地域独立の非パラメトリックテストは行われていない。二重機械学習に基づく非パラメトリックテストを提案する。
論文参考訳（メタデータ） (2022-03-25T10:31:02Z)
Calibration of Neural Networks using Splines [51.42640515410253]
キャリブレーション誤差の測定は、2つの経験的分布を比較します。古典的コルモゴロフ・スミルノフ統計テスト(KS)にインスパイアされたビンニングフリーキャリブレーション尺度を導入する。提案手法は,KS誤差に対する既存の手法と,他の一般的なキャリブレーション手法とを一貫して比較する。
論文参考訳（メタデータ） (2020-06-23T07:18:05Z)
Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文参考訳（メタデータ） (2020-06-09T06:56:31Z)
High-Dimensional Independence Testing via Maximum and Average Distance Correlations [5.756296617325109]
辺依存性次元の数に関して,高次元設定における一貫性特性を特徴付ける。本稿では,各テスト統計の利点を検証し,それぞれのヌル分布を検証し,高速なチ二乗検定手法を提案する。
論文参考訳（メタデータ） (2020-01-04T16:21:50Z)
The Chi-Square Test of Distance Correlation [7.748852202364896]
チ二乗検定は非パラメトリックであり、非常に高速であり、強い負のタイプ計量または特徴核を用いてバイアス補正された距離相関に適用できる。基礎となるカイ二乗分布は上尾部の制限零分布をよく近似し支配しており、カイ二乗試験が独立性テストに有効で一貫性があることを証明している。
論文参考訳（メタデータ） (2019-12-27T15:16:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。