論文の概要: Universally Consistent K-Sample Tests via Dependence Measures
- arxiv url: http://arxiv.org/abs/1910.08883v5
- Date: Sat, 14 Sep 2024 17:36:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-18 06:00:45.255096
- Title: Universally Consistent K-Sample Tests via Dependence Measures
- Title(参考訳): 依存度法による一貫したKサンプル試験
- Authors: Sambit Panda, Cencheng Shen, Ronan Perry, Jelle Zorn, Antoine Lutz, Carey E. Priebe, Joshua T. Vogelstein,
- Abstract要約: Kサンプルテストでは、データポイントのK群がそれぞれ同じ分布から引き出されるかどうかを決定する。
本稿では,任意の依存度を用いてKサンプル試験を行う変換の存在を実証する。
- 参考スコア(独自算出の注目度): 17.57104879511675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The K-sample testing problem involves determining whether K groups of data points are each drawn from the same distribution. Analysis of variance is arguably the most classical method to test mean differences, along with several recent methods to test distributional differences. In this paper, we demonstrate the existence of a transformation that allows K-sample testing to be carried out using any dependence measure. Consequently, universally consistent K-sample testing can be achieved using a universally consistent dependence measure, such as distance correlation and the Hilbert-Schmidt independence criterion. This enables a wide range of dependence measures to be easily applied to K-sample testing.
- Abstract(参考訳): Kサンプルテスト問題は、各データポイントのK群が同じ分布から引き出されるかどうかを決定することである。
分散の解析は、平均差をテストする最も古典的な方法であり、分布差をテストするための最近の方法である。
本稿では,任意の依存度を用いてKサンプル試験を行う変換の存在を実証する。
したがって、距離相関やヒルベルト・シュミット独立基準のような普遍的に一貫した依存度を用いて、普遍的に一貫したKサンプルテストが達成される。
これにより、広範囲の依存度測定がKサンプルテストに容易に適用できる。
関連論文リスト
- On uniqueness of the set of k-means [0.5735035463793009]
非特異性の設定に適応した経験的k平均の整合性を評価する。
k-平均集合の特異性に対するブートストラップ試験を導出する。
結果は、異なる種類の非特異性の例で示される。
論文 参考訳(メタデータ) (2024-10-17T12:40:56Z) - Detecting Adversarial Data by Probing Multiple Perturbations Using
Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。
本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。
EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文 参考訳(メタデータ) (2023-05-25T13:14:58Z) - Using Perturbation to Improve Goodness-of-Fit Tests based on Kernelized
Stein Discrepancy [3.78967502155084]
Kernelized Stein discrepancy (KSD) は、良質なテストで広く使われているスコアベースの不一致である。
我々は、KSD試験が、ターゲットと代替分布が同一の分離モードを持つが混合比が異なる場合、低出力に悩まされることを理論的かつ実証的に示す。
論文 参考訳(メタデータ) (2023-04-28T11:13:18Z) - Targeted Separation and Convergence with Kernel Discrepancies [61.973643031360254]
カーネルベースの不一致測度は、(i)ターゲットPを他の確率測度から分離するか、(ii)Pへの弱収束を制御する必要がある。
本稿では, (i) と (ii) を保証するのに十分な,必要な新しい条件を導出する。
可分距離空間上のMDDに対して、ボヒナー埋め込み可測度を分離するカーネルを特徴づけ、すべての測度を非有界カーネルと分離するための単純な条件を導入する。
論文 参考訳(メタデータ) (2022-09-26T16:41:16Z) - Predicting Out-of-Domain Generalization with Neighborhood Invariance [59.05399533508682]
局所変換近傍における分類器の出力不変性の尺度を提案する。
私たちの測度は計算が簡単で、テストポイントの真のラベルに依存しません。
画像分類,感情分析,自然言語推論のベンチマーク実験において,我々の測定値と実際のOOD一般化との間に強い相関関係を示す。
論文 参考訳(メタデータ) (2022-07-05T14:55:16Z) - Selective inference for k-means clustering [0.0]
k平均クラスタリングを用いて得られた一対のクラスタ間の差分に対する選択型I誤差を制御する有限サンプルp値を提案する。
提案手法をシミュレーションや手書き桁データ,シングルセルRNAシークエンシングデータに適用する。
論文 参考訳(メタデータ) (2022-03-29T06:28:12Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Calibration of Neural Networks using Splines [51.42640515410253]
キャリブレーション誤差の測定は、2つの経験的分布を比較します。
古典的コルモゴロフ・スミルノフ統計テスト(KS)にインスパイアされたビンニングフリーキャリブレーション尺度を導入する。
提案手法は,KS誤差に対する既存の手法と,他の一般的なキャリブレーション手法とを一貫して比較する。
論文 参考訳(メタデータ) (2020-06-23T07:18:05Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - High-Dimensional Independence Testing via Maximum and Average Distance
Correlations [5.756296617325109]
辺依存性次元の数に関して,高次元設定における一貫性特性を特徴付ける。
本稿では,各テスト統計の利点を検証し,それぞれのヌル分布を検証し,高速なチ二乗検定手法を提案する。
論文 参考訳(メタデータ) (2020-01-04T16:21:50Z) - The Chi-Square Test of Distance Correlation [7.748852202364896]
チ二乗検定は非パラメトリックであり、非常に高速であり、強い負のタイプ計量または特徴核を用いてバイアス補正された距離相関に適用できる。
基礎となるカイ二乗分布は上尾部の制限零分布をよく近似し支配しており、カイ二乗試験が独立性テストに有効で一貫性があることを証明している。
論文 参考訳(メタデータ) (2019-12-27T15:16:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。