論文の概要: A Manifold Two-Sample Test Study: Integral Probability Metric with
Neural Networks
- arxiv url: http://arxiv.org/abs/2205.02043v2
- Date: Wed, 19 Apr 2023 23:28:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-21 17:35:18.172095
- Title: A Manifold Two-Sample Test Study: Integral Probability Metric with
Neural Networks
- Title(参考訳): マニフォールド2サンプル実験:ニューラルネットワークを用いた積分確率測定
- Authors: Jie Wang, Minshuo Chen, Tuo Zhao, Wenjing Liao, Yao Xie
- Abstract要約: 2サンプルテストは、2つの観測コレクションが同じ分布に従うかどうかを判断する重要な領域である。
低次元多様体上に支持された高次元試料に対する積分確率距離(IPM)に基づく2サンプル試験を提案する。
提案手法は,データ次元ではなく本質的な次元に大きく依存するため,低次元の幾何学的構造に適応する。
- 参考スコア(独自算出の注目度): 46.62713126719579
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Two-sample tests are important areas aiming to determine whether two
collections of observations follow the same distribution or not. We propose
two-sample tests based on integral probability metric (IPM) for
high-dimensional samples supported on a low-dimensional manifold. We
characterize the properties of proposed tests with respect to the number of
samples $n$ and the structure of the manifold with intrinsic dimension $d$.
When an atlas is given, we propose two-step test to identify the difference
between general distributions, which achieves the type-II risk in the order of
$n^{-1/\max\{d,2\}}$. When an atlas is not given, we propose H\"older IPM test
that applies for data distributions with $(s,\beta)$-H\"older densities, which
achieves the type-II risk in the order of $n^{-(s+\beta)/d}$. To mitigate the
heavy computation burden of evaluating the H\"older IPM, we approximate the
H\"older function class using neural networks. Based on the approximation
theory of neural networks, we show that the neural network IPM test has the
type-II risk in the order of $n^{-(s+\beta)/d}$, which is in the same order of
the type-II risk as the H\"older IPM test. Our proposed tests are adaptive to
low-dimensional geometric structure because their performance crucially depends
on the intrinsic dimension instead of the data dimension.
- Abstract(参考訳): 2サンプルテストは、2つの観測コレクションが同じ分布に従うかどうかを判断する重要な領域である。
低次元多様体上に支持された高次元試料に対する積分確率距離(IPM)に基づく2サンプル試験を提案する。
我々は,本質次元 $d$ を持つ多様体の構造およびサンプル $n$ の個数に関して,提案するテストの性質を特徴付ける。
アトラスが与えられると、一般分布の違いを特定するための2段階のテストを提案し、これは$n^{-1/\max\{d,2\}}$の順序でタイプIIリスクを達成する。
atlasが与えられない場合、$(s,\beta)$-H\'older densitiesを持つデータ分布に適用可能なH\older IPMテストを提案し、$n^{-(s+\beta)/d}$の順でタイプIIリスクを達成する。
ニューラルネットワークを用いてH\"older IPMの評価を行う際の計算負荷を軽減するために,H\"older関数クラスを近似した。
ニューラルネットワークの近似理論に基づき、ニューラルネットワークipmテストは、h\"older ipmテストと同じ2型リスクである$n^{-(s+\beta)/d}$の順でタイプiiのリスクを持つことを示した。
提案手法は,データ次元ではなく本質的な次元に大きく依存するため,低次元の幾何学的構造に適応する。
関連論文リスト
- Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Maximum Mean Discrepancy Meets Neural Networks: The
Radon-Kolmogorov-Smirnov Test [5.255750357176021]
与えられた滑らか度次数$k geq 0$のRBV空間における単位球である$mathcalF$の関数について検討する。
このテストは、よく知られた古典的コルモゴロフ・スミルノフ(KS)テストの多次元および高次滑らか性への一般化と見なすことができる。
我々は、RKSテストの根底にある基準を最適化するために、現代のディープラーニングツールキットの力を活用します。
論文 参考訳(メタデータ) (2023-09-05T17:51:00Z) - Kernel-Based Tests for Likelihood-Free Hypothesis Testing [21.143798051525646]
2つのバランスの取れたクラスから$n$の観測が与えられたとき、追加の$m$入力をラベル付けするタスクを考える。
この問題の特別なケースはよく知られており、$m=1$はバイナリ分類に対応し、$mapprox n$は2サンプルテストに相当する。
最近の研究で、$m$と$n$の間に根本的なトレードオフがあることが判明した。
論文 参考訳(メタデータ) (2023-08-17T15:24:03Z) - High-Dimensional Smoothed Entropy Estimation via Dimensionality
Reduction [14.53979700025531]
微分エントロピー$h(X+Z)$を独立に$n$で推定し、同じ分散サンプルを$X$とする。
絶対誤差損失では、上記の問題はパラメータ推定率$fraccDsqrtn$である。
我々は、エントロピー推定の前に主成分分析(PCA)を通して低次元空間に$X$を投影することで、この指数的なサンプル複雑性を克服する。
論文 参考訳(メタデータ) (2023-05-08T13:51:48Z) - On the Identifiability and Estimation of Causal Location-Scale Noise
Models [122.65417012597754]
位置スケール・異方性雑音モデル(LSNM)のクラスについて検討する。
症例によっては, 因果方向が同定可能であることが示唆された。
我々は,LSNMの2つの推定器を提案し,その1つは(非線形)特徴写像に基づく推定器と,1つはニューラルネットワークに基づく推定器を提案する。
論文 参考訳(メタデータ) (2022-10-13T17:18:59Z) - Fundamental tradeoffs between memorization and robustness in random
features and neural tangent regimes [15.76663241036412]
モデルがトレーニングのごく一部を記憶している場合、そのソボレフ・セミノルムは低い有界であることを示す。
実験によって初めて、(iv)ミンノルム補間器の堅牢性における多重発色現象が明らかになった。
論文 参考訳(メタデータ) (2021-06-04T17:52:50Z) - Learning Deep Kernels for Non-Parametric Two-Sample Tests [50.92621794426821]
2組のサンプルが同じ分布から引き出されるかどうかを判定するカーネルベースの2サンプルテストのクラスを提案する。
私たちのテストは、テストパワーを最大化するためにトレーニングされたディープニューラルネットワークによってパラメータ化されたカーネルから構築されます。
論文 参考訳(メタデータ) (2020-02-21T03:54:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。