論文の概要: Kernel Two-Sample Testing via Directional Components Analysis
- arxiv url: http://arxiv.org/abs/2508.08564v2
- Date: Wed, 20 Aug 2025 07:04:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 12:38:45.384879
- Title: Kernel Two-Sample Testing via Directional Components Analysis
- Title(参考訳): 方向成分分析によるカーネル2サンプルテスト
- Authors: Rui Cui, Yuhao Li, Xiaojun Song,
- Abstract要約: 本稿では,カーネルHilbert空間(RKHS)において,よく見積もられた方向成分を同定し,利用するためのカーネルベースの2サンプルテストを提案する。
これらの方向に着目し、複数のカーネルにまたがる情報を集約することにより、特に高次元およびアンバランスなサンプル設定において、高いパワーとロバスト性を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a novel kernel-based two-sample test that leverages the spectral decomposition of the maximum mean discrepancy (MMD) statistic to identify and utilize well-estimated directional components in reproducing kernel Hilbert space (RKHS). Our approach is motivated by the observation that the estimation quality of these components varies significantly, with leading eigen-directions being more reliably estimated in finite samples. By focusing on these directions and aggregating information across multiple kernels, the proposed test achieves higher power and improved robustness, especially in high-dimensional and unbalanced sample settings. We further develop a computationally efficient multiplier bootstrap procedure for approximating critical values, which is theoretically justified and significantly faster than permutation-based alternatives. Extensive simulations and empirical studies on microarray datasets demonstrate that our method maintains the nominal Type I error rate and delivers superior power compared to other existing MMD-based tests.
- Abstract(参考訳): 本稿では,カーネル・ヒルベルト空間(RKHS)において,最大平均差分率(MMD)統計量のスペクトル分解を利用して,よく推定された方向成分を同定し,利用するためのカーネルベースの2サンプルテストを提案する。
提案手法は, これらの成分の推定品質が, 有限標本においてより確実な推定を導出することにより, 著しく異なることが示唆された。
これらの方向に着目し、複数のカーネルにまたがる情報を集約することにより、特に高次元およびアンバランスなサンプル設定において、高いパワーとロバスト性を実現する。
さらに, 計算効率のよい乗算器ブートストラップ法を開発し, 理論上は正当であり, 置換法よりもはるかに高速であることを示す。
マイクロアレイデータセットの大規模シミュレーションと実証実験により,本手法は名目上のI型エラー率を維持し,既存のMDDベーステストと比較して優れた性能を発揮することが示された。
関連論文リスト
- MMD-FUSE: Learning and Combining Kernels for Two-Sample Testing Without
Data Splitting [28.59390881834003]
最大平均離散性(MMD)に基づく2サンプルテストのパワーを最大化する新しい統計法を提案する。
これらのカーネルは、データ分割を避けるために、よく校正されたテストで、データ依存だが置換に依存しない方法でどのように選択できるかを示す。
我々は,合成低次元および実世界の高次元データに対するMDD-FUSEテストの適用性を強調し,その性能を現状のカーネルテストと比較した。
論文 参考訳(メタデータ) (2023-06-14T23:13:03Z) - Boosting the Power of Kernel Two-Sample Tests [4.07125466598411]
最大平均誤差(MMD)に基づくカーネル2サンプルテストは、一般的な距離空間上の2つの分布の違いを検出する最も一般的な方法の1つである。
マハラノビス距離を用いて,複数のカーネル上でMDD推定値を組み合わせることで,カーネルテストのパワーを高める手法を提案する。
論文 参考訳(メタデータ) (2023-02-21T14:14:30Z) - Spectral Regularized Kernel Two-Sample Tests [7.915420897195129]
MMD (maximum mean discrepancy) two-sample test to be optimal to the terms of the separation boundary in the Hellinger distance。
スペクトル正則化に基づくMDD試験の修正を提案し,MMD試験よりも分離境界が小さく,最小限の試験が最適であることを証明した。
その結果,テストしきい値がエレガントに選択されるテストの置換変種が,サンプルの置換によって決定されることがわかった。
論文 参考訳(メタデータ) (2022-12-19T00:42:21Z) - Targeted Separation and Convergence with Kernel Discrepancies [61.973643031360254]
カーネルベースの不一致測度は、(i)ターゲットPを他の確率測度から分離するか、(ii)Pへの弱収束を制御する必要がある。
本稿では, (i) と (ii) を保証するのに十分な,必要な新しい条件を導出する。
可分距離空間上のMDDに対して、ボヒナー埋め込み可測度を分離するカーネルを特徴づけ、すべての測度を非有界カーネルと分離するための単純な条件を導入する。
論文 参考訳(メタデータ) (2022-09-26T16:41:16Z) - Learning Deep Kernels for Non-Parametric Two-Sample Tests [50.92621794426821]
2組のサンプルが同じ分布から引き出されるかどうかを判定するカーネルベースの2サンプルテストのクラスを提案する。
私たちのテストは、テストパワーを最大化するためにトレーニングされたディープニューラルネットワークによってパラメータ化されたカーネルから構築されます。
論文 参考訳(メタデータ) (2020-02-21T03:54:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。