論文の概要: The Sketched Wasserstein Distance for mixture distributions
- arxiv url: http://arxiv.org/abs/2206.12768v1
- Date: Sun, 26 Jun 2022 02:33:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-28 16:22:57.927226
- Title: The Sketched Wasserstein Distance for mixture distributions
- Title(参考訳): 混合分布に対するSketched Wasserstein Distance
- Authors: Xin Bing and Florentina Bunea and Jonathan Niles-Weed
- Abstract要約: スケッチド・ワッサースタイン距離(英: Sketched Wasserstein Distance)(WS$)は、有限混合分布に特化された新しい確率距離である。
我々は、$WS$が、$mathcalS = textrmconv(mathcalA)$ の要素の混合の空間に最も区別できるものとして定義されることを示す。
- 参考スコア(独自算出の注目度): 13.643197515573029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Sketched Wasserstein Distance ($W^S$) is a new probability distance
specifically tailored to finite mixture distributions. Given any metric $d$
defined on a set $\mathcal{A}$ of probability distributions, $W^S$ is defined
to be the most discriminative convex extension of this metric to the space
$\mathcal{S} = \textrm{conv}(\mathcal{A})$ of mixtures of elements of
$\mathcal{A}$. Our representation theorem shows that the space $(\mathcal{S},
W^S)$ constructed in this way is isomorphic to a Wasserstein space over
$\mathcal{X} = (\mathcal{A}, d)$. This result establishes a universality
property for the Wasserstein distances, revealing them to be uniquely
characterized by their discriminative power for finite mixtures. We exploit
this representation theorem to propose an estimation methodology based on
Kantorovich--Rubenstein duality, and prove a general theorem that shows that
its estimation error can be bounded by the sum of the errors of estimating the
mixture weights and the mixture components, for any estimators of these
quantities. We derive sharp statistical properties for the estimated $W^S$ in
the case of $p$-dimensional discrete $K$-mixtures, which we show can be
estimated at a rate proportional to $\sqrt{K/N}$, up to logarithmic factors. We
complement these bounds with a minimax lower bound on the risk of estimating
the Wasserstein distance between distributions on a $K$-point metric space,
which matches our upper bound up to logarithmic factors. This result is the
first nearly tight minimax lower bound for estimating the Wasserstein distance
between discrete distributions. Furthermore, we construct $\sqrt{N}$
asymptotically normal estimators of the mixture weights, and derive a
$\sqrt{N}$ distributional limit of our estimator of $W^S$ as a consequence.
Simulation studies and a data analysis provide strong support on the
applicability of the new Sketched Wasserstein Distance.
- Abstract(参考訳): スケッチド・ワッサースタイン距離(Sketched Wasserstein Distance)(W^S$)は、有限混合分布に特化された新しい確率距離である。
確率分布の集合 $\mathcal{a}$ 上で定義される任意の計量 $d$ に対して、$w^s$ は、$\mathcal{a}$ の元の混合の空間 $\mathcal{s} = \textrm{conv}(\mathcal{a})$ へのこの計量の最も差別的な凸拡大であると定義される。
我々の表現定理は、この方法で構築された空間 $(\mathcal{S}, W^S)$ が、$\mathcal{X} = (\mathcal{A}, d)$ 上のワッサーシュタイン空間に同型であることを示している。
この結果はワッサーシュタイン距離の普遍性を確立し、それらが有限混合に対する識別力によって一意に特徴づけられることを示した。
この表現定理を利用して、カントロビッチ-ルベンシュタイン双対性に基づく推定手法を提案し、その推定誤差が、混合重みと混合成分を推定する誤差の和で有界であることを示す一般的な定理を、これらの量の推定者に対して証明する。
我々は、$p$-次元離散$K$-混合の場合、推定された$W^S$に対して鋭い統計特性を導出し、これは対数因子まで$\sqrt{K/N}$に比例して推定できることを示す。
我々はこれらの境界を、K$ポイント計量空間上の分布間のワッサーシュタイン距離を推定するリスクに基づいてミニマックス下界で補う。
この結果は、離散分布間のワッサースタイン距離を推定する最初のほとんどタイトなミニマックス下限である。
さらに、混合重みの漸近的に正規な推定器を$\sqrt{N}$で構築し、その結果、W^S$の推定器の分布極限を$\sqrt{N}$で導き出す。
シミュレーション研究とデータ解析は、新しいスケッチされたwaserstein距離の適用性を強く支持する。
関連論文リスト
- Summarizing Bayesian Nonparametric Mixture Posterior -- Sliced Optimal Transport Metrics for Gaussian Mixtures [10.694077392690447]
混合モデルの後方推論を要約する既存の方法は、クラスタリングのための暗黙のランダムパーティションの点推定を同定することに焦点を当てている。
本研究では,非パラメトリックベイズ混合モデルにおける後部推論を要約し,混合度(または混合度)の密度推定を推論対象として優先順位付けする手法を提案する。
論文 参考訳(メタデータ) (2024-11-22T02:15:38Z) - Sobolev Space Regularised Pre Density Models [51.558848491038916]
本研究では,ソボレフ法則の正則化に基づく非パラメトリック密度推定法を提案する。
この方法は統計的に一貫したものであり、帰納的検証モデルを明確かつ一貫したものにしている。
論文 参考訳(メタデータ) (2023-07-25T18:47:53Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - Tangent Space and Dimension Estimation with the Wasserstein Distance [10.118241139691952]
ユークリッド空間の滑らかなコンパクト部分多様体の近くで独立にサンプリングされた点の集合を考える。
我々は、その多様体の次元と接空間の両方を推定するために必要なサンプル点の数について数学的に厳密な境界を与える。
論文 参考訳(メタデータ) (2021-10-12T21:02:06Z) - Depth-based pseudo-metrics between probability distributions [1.1470070927586016]
本研究では,データ深度に基づく連続確率測度と関連する中央領域の2つの疑似測度を提案する。
Wasserstein距離とは対照的に、提案された疑似メトリックは次元の呪いに苦しむことはない。
地域ベースの擬似メトリックは堅牢なw.r.tである。
両端と尾が重い。
論文 参考訳(メタデータ) (2021-03-23T17:33:18Z) - Continuous Wasserstein-2 Barycenter Estimation without Minimax
Optimization [94.18714844247766]
ワッサーシュタイン・バリセンターは、最適輸送に基づく確率測度の重み付き平均の幾何学的概念を提供する。
本稿では,Wasserstein-2 バリセンタのサンプルアクセスを演算するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-02T21:01:13Z) - Two-sample Test using Projected Wasserstein Distance [18.46110328123008]
統計学と機械学習の基本的な問題である2サンプルテストのための予測されたワッサースタイン距離を開発する。
重要な貢献は、投影された確率分布の間のワッサーシュタイン距離を最大化する低次元線型写像を見つけるために最適射影を結合することである。
論文 参考訳(メタデータ) (2020-10-22T18:08:58Z) - On Projection Robust Optimal Transport: Sample Complexity and Model
Misspecification [101.0377583883137]
射影ロバスト(PR)OTは、2つの測度の間のOTコストを最大化するために、射影可能な$k$次元部分空間を選択する。
私たちの最初の貢献は、PRワッサーシュタイン距離のいくつかの基本的な統計的性質を確立することである。
次に、部分空間を最適化するのではなく平均化することにより、PRW距離の代替として積分PRワッサーシュタイン距離(IPRW)を提案する。
論文 参考訳(メタデータ) (2020-06-22T14:35:33Z) - When OT meets MoM: Robust estimation of Wasserstein Distance [8.812837829361923]
本稿では,2つの確率分布間のワッサーシュタイン距離を,観測結果が外れ値によって汚染されると推定する問題を考察する。
データ汚染モデルに基づいて, 一貫性を検証した新しいMoMベースのロバスト推定器について紹介し, 議論する。
そこで本研究では,シンクホーンアルゴリズムと組み合わせて使用可能な,シンプルなMoMに基づく再重み付け手法を提案する。
論文 参考訳(メタデータ) (2020-06-18T07:31:39Z) - Minimax Optimal Estimation of KL Divergence for Continuous Distributions [56.29748742084386]
Kullback-Leibler の同一および独立に分布するサンプルからの発散は、様々な領域において重要な問題である。
単純で効果的な推定器の1つは、これらのサンプル間の近辺 k に基づいている。
論文 参考訳(メタデータ) (2020-02-26T16:37:37Z) - Distributed, partially collapsed MCMC for Bayesian Nonparametrics [68.5279360794418]
ディリクレ法やベータ・ベルヌーリ法のようなモデルでよく用いられる完全無作為測度は独立な部分測度に分解可能であるという事実を利用する。
この分解を用いて、潜在測度を、インスタンス化された成分のみを含む有限測度と、他のすべての成分を含む無限測度に分割する。
得られたハイブリッドアルゴリズムは、収束保証を犠牲にすることなくスケーラブルな推論を可能にすることができる。
論文 参考訳(メタデータ) (2020-01-15T23:10:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。