論文の概要: The Sketched Wasserstein Distance for mixture distributions
- arxiv url: http://arxiv.org/abs/2206.12768v1
- Date: Sun, 26 Jun 2022 02:33:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-28 16:22:57.927226
- Title: The Sketched Wasserstein Distance for mixture distributions
- Title(参考訳): 混合分布に対するSketched Wasserstein Distance
- Authors: Xin Bing and Florentina Bunea and Jonathan Niles-Weed
- Abstract要約: スケッチド・ワッサースタイン距離(英: Sketched Wasserstein Distance)(WS$)は、有限混合分布に特化された新しい確率距離である。
我々は、$WS$が、$mathcalS = textrmconv(mathcalA)$ の要素の混合の空間に最も区別できるものとして定義されることを示す。
- 参考スコア(独自算出の注目度): 13.643197515573029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Sketched Wasserstein Distance ($W^S$) is a new probability distance
specifically tailored to finite mixture distributions. Given any metric $d$
defined on a set $\mathcal{A}$ of probability distributions, $W^S$ is defined
to be the most discriminative convex extension of this metric to the space
$\mathcal{S} = \textrm{conv}(\mathcal{A})$ of mixtures of elements of
$\mathcal{A}$. Our representation theorem shows that the space $(\mathcal{S},
W^S)$ constructed in this way is isomorphic to a Wasserstein space over
$\mathcal{X} = (\mathcal{A}, d)$. This result establishes a universality
property for the Wasserstein distances, revealing them to be uniquely
characterized by their discriminative power for finite mixtures. We exploit
this representation theorem to propose an estimation methodology based on
Kantorovich--Rubenstein duality, and prove a general theorem that shows that
its estimation error can be bounded by the sum of the errors of estimating the
mixture weights and the mixture components, for any estimators of these
quantities. We derive sharp statistical properties for the estimated $W^S$ in
the case of $p$-dimensional discrete $K$-mixtures, which we show can be
estimated at a rate proportional to $\sqrt{K/N}$, up to logarithmic factors. We
complement these bounds with a minimax lower bound on the risk of estimating
the Wasserstein distance between distributions on a $K$-point metric space,
which matches our upper bound up to logarithmic factors. This result is the
first nearly tight minimax lower bound for estimating the Wasserstein distance
between discrete distributions. Furthermore, we construct $\sqrt{N}$
asymptotically normal estimators of the mixture weights, and derive a
$\sqrt{N}$ distributional limit of our estimator of $W^S$ as a consequence.
Simulation studies and a data analysis provide strong support on the
applicability of the new Sketched Wasserstein Distance.
- Abstract(参考訳): スケッチド・ワッサースタイン距離(Sketched Wasserstein Distance)(W^S$)は、有限混合分布に特化された新しい確率距離である。
確率分布の集合 $\mathcal{a}$ 上で定義される任意の計量 $d$ に対して、$w^s$ は、$\mathcal{a}$ の元の混合の空間 $\mathcal{s} = \textrm{conv}(\mathcal{a})$ へのこの計量の最も差別的な凸拡大であると定義される。
我々の表現定理は、この方法で構築された空間 $(\mathcal{S}, W^S)$ が、$\mathcal{X} = (\mathcal{A}, d)$ 上のワッサーシュタイン空間に同型であることを示している。
この結果はワッサーシュタイン距離の普遍性を確立し、それらが有限混合に対する識別力によって一意に特徴づけられることを示した。
この表現定理を利用して、カントロビッチ-ルベンシュタイン双対性に基づく推定手法を提案し、その推定誤差が、混合重みと混合成分を推定する誤差の和で有界であることを示す一般的な定理を、これらの量の推定者に対して証明する。
我々は、$p$-次元離散$K$-混合の場合、推定された$W^S$に対して鋭い統計特性を導出し、これは対数因子まで$\sqrt{K/N}$に比例して推定できることを示す。
我々はこれらの境界を、K$ポイント計量空間上の分布間のワッサーシュタイン距離を推定するリスクに基づいてミニマックス下界で補う。
この結果は、離散分布間のワッサースタイン距離を推定する最初のほとんどタイトなミニマックス下限である。
さらに、混合重みの漸近的に正規な推定器を$\sqrt{N}$で構築し、その結果、W^S$の推定器の分布極限を$\sqrt{N}$で導き出す。
シミュレーション研究とデータ解析は、新しいスケッチされたwaserstein距離の適用性を強く支持する。
関連論文リスト
- Sharp bounds for max-sliced Wasserstein distances [0.0]
我々は、分離可能なヒルベルト空間上の確率測度と、$n$サンプルからの経験的分布との予想最大1-ワッサーシュタイン距離の上限と下限を一致させる。
また、ユークリッド空間上の対称確率測度$mu$の間の予想最大2-ワッサーシュタイン距離に対して、対数係数まで鋭い上限を得る。
論文 参考訳(メタデータ) (2024-03-01T16:55:10Z) - Estimating the Mixing Coefficients of Geometrically Ergodic Markov
Processes [5.00389879175348]
実数値の幾何学的エルゴード的マルコフ過程の個々の$beta$-mixing係数を1つのサンプルパスから推定する。
予想される誤差率は$mathcal O(log(n) n-1/2)$である。
論文 参考訳(メタデータ) (2024-02-11T20:17:10Z) - Properties of Discrete Sliced Wasserstein Losses [2.7624021966289605]
スライスされたワッサーシュタイン距離(SW)は、確率測度を比較するためにワッサーシュタイン距離の代替として人気がある。
広範囲のアプリケーションには画像処理、ドメイン適応、生成モデリングが含まれており、SWを最小化するためにパラメータを最適化することが一般的である。
このエネルギーの正則性と最適化特性、およびモンテカルロ近似 $mathcalE_p$ について検討する。
論文 参考訳(メタデータ) (2023-07-19T21:21:18Z) - Effective Minkowski Dimension of Deep Nonparametric Regression: Function
Approximation and Statistical Theories [70.90012822736988]
ディープ非パラメトリック回帰に関する既存の理論は、入力データが低次元多様体上にある場合、ディープニューラルネットワークは本質的なデータ構造に適応できることを示した。
本稿では,$mathcalS$で表される$mathbbRd$のサブセットに入力データが集中するという緩和された仮定を導入する。
論文 参考訳(メタデータ) (2023-06-26T17:13:31Z) - Statistical Learning under Heterogeneous Distribution Shift [71.8393170225794]
ground-truth predictor is additive $mathbbE[mathbfz mid mathbfx,mathbfy] = f_star(mathbfx) +g_star(mathbfy)$.
論文 参考訳(メタデータ) (2023-02-27T16:34:21Z) - Robust Estimation under the Wasserstein Distance [28.792608997509376]
出力分布から外周質量が$varepsilon$を除去できる新しい外周ローバストワッサーシュタイン距離$mathsfW_pvarepsilon$を導入する。
我々は,$mathsfW_pvarepsilon$で最小距離推定を行うことで,最小限のロバスト推定リスクが得られることを示した。
論文 参考訳(メタデータ) (2023-02-02T17:20:25Z) - Non-Parametric Estimation of Manifolds from Noisy Data [1.0152838128195467]
ノイズの多いサンプルの有限集合から$mathbbRD$の$d$次元部分多様体を推定する問題を検討する。
点推定では$n-frack2k + d$、接空間の推定では$n-frack-12k + d$の収束率を推定する。
論文 参考訳(メタデータ) (2021-05-11T02:29:33Z) - Optimal Mean Estimation without a Variance [103.26777953032537]
本研究では,データ生成分布の分散が存在しない環境での重み付き平均推定問題について検討する。
最小の信頼区間を$n,d,delta$の関数として得る推定器を設計する。
論文 参考訳(メタデータ) (2020-11-24T22:39:21Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
非同期Q-ラーニングはマルコフ決定過程(MDP)の最適行動値関数(またはQ-関数)を学習することを目的としている。
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z) - Robustly Learning any Clusterable Mixture of Gaussians [55.41573600814391]
本研究では,高次元ガウス混合系の対向ロバスト条件下での効率的な学習性について検討する。
理論的に最適に近い誤り証明である$tildeO(epsilon)$の情報を、$epsilon$-corrupted $k$-mixtureで学習するアルゴリズムを提供する。
我々の主な技術的貢献は、ガウス混合系からの新しい頑健な識別可能性証明クラスターであり、これは正方形の定度証明システムによって捉えることができる。
論文 参考訳(メタデータ) (2020-05-13T16:44:12Z) - A diffusion approach to Stein's method on Riemannian manifolds [65.36007959755302]
我々は、ターゲット不変測度を持つ$mathbf M$上の拡散の生成元と、その特徴付けStein演算子との関係を利用する。
我々は、スタイン方程式とその微分に解を束縛するスタイン因子を導出する。
我々は、$mathbf M$ が平坦多様体であるとき、$mathbb Rm$ の有界が有効であることを暗示する。
論文 参考訳(メタデータ) (2020-03-25T17:03:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。