論文の概要: From Smooth Wasserstein Distance to Dual Sobolev Norm: Empirical
Approximation and Statistical Applications
- arxiv url: http://arxiv.org/abs/2101.04039v2
- Date: Thu, 14 Jan 2021 18:39:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 14:28:22.897678
- Title: From Smooth Wasserstein Distance to Dual Sobolev Norm: Empirical
Approximation and Statistical Applications
- Title(参考訳): Smooth Wasserstein Distance から Dual Sobolev Norm へ:実証近似と統計的応用
- Authors: Sloan Nietert, Ziv Goldfeld, Kengo Kato
- Abstract要約: 我々は$mathsfW_p(sigma)$が$pth次スムーズな双対ソボレフ$mathsfd_p(sigma)$で制御されていることを示す。
我々は、すべての次元において$sqrtnmathsfd_p(sigma)(hatmu_n,mu)$の極限分布を導出する。
- 参考スコア(独自算出の注目度): 18.618590805279187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Statistical distances, i.e., discrepancy measures between probability
distributions, are ubiquitous in probability theory, statistics and machine
learning. To combat the curse of dimensionality when estimating these distances
from data, recent work has proposed smoothing out local irregularities in the
measured distributions via convolution with a Gaussian kernel. Motivated by the
scalability of the smooth framework to high dimensions, we conduct an in-depth
study of the structural and statistical behavior of the Gaussian-smoothed
$p$-Wasserstein distance $\mathsf{W}_p^{(\sigma)}$, for arbitrary $p\geq 1$. We
start by showing that $\mathsf{W}_p^{(\sigma)}$ admits a metric structure that
is topologically equivalent to classic $\mathsf{W}_p$ and is stable with
respect to perturbations in $\sigma$. Moving to statistical questions, we
explore the asymptotic properties of
$\mathsf{W}_p^{(\sigma)}(\hat{\mu}_n,\mu)$, where $\hat{\mu}_n$ is the
empirical distribution of $n$ i.i.d. samples from $\mu$. To that end, we prove
that $\mathsf{W}_p^{(\sigma)}$ is controlled by a $p$th order smooth dual
Sobolev norm $\mathsf{d}_p^{(\sigma)}$. Since
$\mathsf{d}_p^{(\sigma)}(\hat{\mu}_n,\mu)$ coincides with the supremum of an
empirical process indexed by Gaussian-smoothed Sobolev functions, it lends
itself well to analysis via empirical process theory. We derive the limit
distribution of $\sqrt{n}\mathsf{d}_p^{(\sigma)}(\hat{\mu}_n,\mu)$ in all
dimensions $d$, when $\mu$ is sub-Gaussian. Through the aforementioned bound,
this implies a parametric empirical convergence rate of $n^{-1/2}$ for
$\mathsf{W}_p^{(\sigma)}$, contrasting the $n^{-1/d}$ rate for unsmoothed
$\mathsf{W}_p$ when $d \geq 3$. As applications, we provide asymptotic
guarantees for two-sample testing and minimum distance estimation. When $p=2$,
we further show that $\mathsf{d}_2^{(\sigma)}$ can be expressed as a maximum
mean discrepancy.
- Abstract(参考訳): 統計的距離、すなわち確率分布間の差測度は確率論、統計学、機械学習においてユビキタスである。
データから距離を推定する際の次元の呪いに対処するため、ガウス核との畳み込みによって測定された分布の局所的不規則性を平滑化することを提案した。
滑らかな枠組みの高次元への拡張性に動機づけられ、任意の $p\geq 1$ に対して、ガウスのスムースである $p$-wasserstein 距離 $\mathsf{w}_p^{(\sigma)}$ の構造的および統計的挙動を詳細に研究した。
まず、$\mathsf{w}_p^{(\sigma)}$ は、古典的な$\mathsf{w}_p$ と位相的に等価で、$\sigma$ の摂動に関して安定な計量構造を持つことを示すことから始める。
統計的な問題に移行して、$\hat{\mu}_n$ の漸近的性質を探索し、$\hat{\mu}_n$ は$n$ i.d の経験的分布である。
サンプルは$\mu$。
この目的のために、$\mathsf{W}_p^{(\sigma)}$が$p$2次滑らかな双対ソボレフノルム$\mathsf{d}_p^{(\sigma)}$で制御されていることを証明している。
{\mathsf{d}_p^{(\sigma)}(\hat{\mu}_n,\mu)$ はガウスの滑らかなソボレフ関数によってインデックスづけされた経験的過程の上限と一致するので、経験的過程理論による解析に有利である。
任意の次元$d$ において、$\sqrt{n}\mathsf{d}_p^{(\sigma)}(\hat{\mu}_n,\mu)$ の極限分布を導出する。
上記の境界を通じて、パラメトリックな経験的収束率は$n^{-1/2}$で$\mathsf{w}_p^{(\sigma)}$であり、$d \geq 3$のとき$n^{-1/d}$が$smoothed $\mathsf{w}_p$であるのとは対照的である。
アプリケーションとして、2サンプルテストと最小距離推定の漸近保証を提供する。
p=2$ の場合、さらに $\mathsf{d}_2^{(\sigma)}$ を最大平均不一致として表現できることを示す。
関連論文リスト
- Dimension-free Private Mean Estimation for Anisotropic Distributions [55.86374912608193]
以前の$mathRd上の分布に関する民間推定者は、次元性の呪いに苦しむ。
本稿では,サンプルの複雑さが次元依存性を改善したアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-01T17:59:53Z) - Improved convergence rate of kNN graph Laplacians [11.93971616098517]
k$NNグラフの一般クラスで、グラフ親和性は$W_ij = epsilon-d/2 である。
制限多様体作用素に対する$k$NNグラフ Laplacian の点収束性を証明する。
論文 参考訳(メタデータ) (2024-10-30T17:01:00Z) - Estimation and Inference in Distributional Reinforcement Learning [28.253677740976197]
サイズ$widetilde Oleft(frac|mathcalS||mathcalA|epsilon2 (1-gamma)4right)$ suffices to ensure the Kolmogorov metric and total variation metric between $hatetapi$ and $etapi$ is below $epsilon$ with high probability。
以上の結果から,多種多様な統計的汎関数の統計的推測への統一的アプローチがもたらされた。
論文 参考訳(メタデータ) (2023-09-29T14:14:53Z) - A Unified Framework for Uniform Signal Recovery in Nonlinear Generative
Compressed Sensing [68.80803866919123]
非線形測定では、ほとんどの先行結果は一様ではない、すなわち、すべての$mathbfx*$に対してではなく、固定された$mathbfx*$に対して高い確率で保持される。
本フレームワークはGCSに1ビット/一様量子化観測と単一インデックスモデルを標準例として適用する。
また、指標集合が計量エントロピーが低い製品プロセスに対して、より厳密な境界を生み出す濃度不等式も開発する。
論文 参考訳(メタデータ) (2023-09-25T17:54:19Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - Structure Learning in Graphical Models from Indirect Observations [17.521712510832558]
本稿では、パラメータ法と非パラメトリック法の両方を用いて、Rp$における$p$次元ランダムベクトル$Xのグラフィカル構造を学習する。
温和な条件下では、グラフ構造推定器が正しい構造を得ることができることを示す。
論文 参考訳(メタデータ) (2022-05-06T19:24:44Z) - Random matrices in service of ML footprint: ternary random features with
no performance loss [55.30329197651178]
我々は、$bf K$ の固有スペクトルが$bf w$ の i.d. 成分の分布とは独立であることを示す。
3次ランダム特徴(TRF)と呼ばれる新しいランダム手法を提案する。
提案したランダムな特徴の計算には乗算が不要であり、古典的なランダムな特徴に比べてストレージに$b$のコストがかかる。
論文 参考訳(メタデータ) (2021-10-05T09:33:49Z) - Nonasymptotic one-and two-sample tests in high dimension with unknown
covariance structure [0.0]
テストの問題は、$mu が 0 に対して $eta-閉である場合、すなわち $|mu| geq (eta + delta)$ に対して $|mu| leq eta である。
本研究の目的は,I型とII型の両方の誤差を所定のレベルで制御できるように,最小分離距離$の漸近的上下境界を求めることである。
論文 参考訳(メタデータ) (2021-09-01T06:22:53Z) - Non-Parametric Estimation of Manifolds from Noisy Data [1.0152838128195467]
ノイズの多いサンプルの有限集合から$mathbbRD$の$d$次元部分多様体を推定する問題を検討する。
点推定では$n-frack2k + d$、接空間の推定では$n-frack-12k + d$の収束率を推定する。
論文 参考訳(メタデータ) (2021-05-11T02:29:33Z) - Agnostic Learning of a Single Neuron with Gradient Descent [92.7662890047311]
期待される正方形損失から、最も適合した単一ニューロンを学習することの問題点を考察する。
ReLUアクティベーションでは、我々の人口リスク保証は$O(mathsfOPT1/2)+epsilon$である。
ReLUアクティベーションでは、我々の人口リスク保証は$O(mathsfOPT1/2)+epsilon$である。
論文 参考訳(メタデータ) (2020-05-29T07:20:35Z) - Curse of Dimensionality on Randomized Smoothing for Certifiable
Robustness [151.67113334248464]
我々は、他の攻撃モデルに対してスムースな手法を拡張することは困難であることを示す。
我々はCIFARに関する実験結果を示し,その理論を検証した。
論文 参考訳(メタデータ) (2020-02-08T22:02:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。