論文の概要: Statistical, Robustness, and Computational Guarantees for Sliced
Wasserstein Distances
- arxiv url: http://arxiv.org/abs/2210.09160v1
- Date: Mon, 17 Oct 2022 15:04:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 17:04:35.539794
- Title: Statistical, Robustness, and Computational Guarantees for Sliced
Wasserstein Distances
- Title(参考訳): スライスワッサースタイン距離の統計・ロバスト性・計算保証
- Authors: Sloan Nietert, Ritwik Sadhu, Ziv Goldfeld, and Kengo Kato
- Abstract要約: スライスされたワッサーシュタイン距離は古典的なワッサーシュタイン距離の性質を保ちながら、高次元での計算と推定によりスケーラブルである。
このスケーラビリティを, (i) 経験的収束率, (ii) データの汚染に対する堅牢性, (iii) 効率的な計算方法という3つの重要な側面から定量化する。
- 参考スコア(独自算出の注目度): 18.9717974398864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sliced Wasserstein distances preserve properties of classic Wasserstein
distances while being more scalable for computation and estimation in high
dimensions. The goal of this work is to quantify this scalability from three
key aspects: (i) empirical convergence rates; (ii) robustness to data
contamination; and (iii) efficient computational methods. For empirical
convergence, we derive fast rates with explicit dependence of constants on
dimension, subject to log-concavity of the population distributions. For
robustness, we characterize minimax optimal, dimension-free robust estimation
risks, and show an equivalence between robust sliced 1-Wasserstein estimation
and robust mean estimation. This enables lifting statistical and algorithmic
guarantees available for the latter to the sliced 1-Wasserstein setting. Moving
on to computational aspects, we analyze the Monte Carlo estimator for the
average-sliced distance, demonstrating that larger dimension can result in
faster convergence of the numerical integration error. For the max-sliced
distance, we focus on a subgradient-based local optimization algorithm that is
frequently used in practice, albeit without formal guarantees, and establish an
$O(\epsilon^{-4})$ computational complexity bound for it. Our theory is
validated by numerical experiments, which altogether provide a comprehensive
quantitative account of the scalability question.
- Abstract(参考訳): スライスされたワッサーシュタイン距離は古典的なワッサーシュタイン距離の性質を保ちながら、高次元での計算と推定によりスケーラブルである。
この作業の目標は、このスケーラビリティを3つの重要な側面から定量化することです。
一 経験的収束率
(ii)データ汚染に対する堅牢性
(iii)効率的な計算方法。
経験的収束のために、人口分布の対数共空性(log-concavity)を条件として、定数の次元への明示的に依存した高速速度を導出する。
ロバストネスについては,最小限の最適,次元自由なロバスト推定リスクを特徴付けるとともに,ロバストスライスされた1-ワッサーシュタイン推定とロバスト平均推定の等価性を示す。
これにより、統計的およびアルゴリズム的保証を、スライスされた1-wasserstein設定に引き上げることができる。
計算の面では、平均スライス距離のモンテカルロ推定器を解析し、より大きな次元が数値積分誤差のより高速な収束をもたらすことを証明した。
最大スライス距離については、形式的保証なしに、実際に頻繁に使用される下位勾配に基づく局所最適化アルゴリズムに焦点をあて、それに束縛された$o(\epsilon^{-4})$計算複雑性を確立する。
この理論を数値実験により検証し,拡張性問題に関する包括的定量的な考察を行った。
関連論文リスト
- Linearized Wasserstein dimensionality reduction with approximation
guarantees [65.16758672591365]
LOT Wassmap は、ワーッサーシュタイン空間の低次元構造を明らかにするための計算可能なアルゴリズムである。
我々は,LOT Wassmapが正しい埋め込みを実現し,サンプルサイズの増加とともに品質が向上することを示す。
また、LOT Wassmapがペア距離計算に依存するアルゴリズムと比較して計算コストを大幅に削減することを示す。
論文 参考訳(メタデータ) (2023-02-14T22:12:16Z) - Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。
これらの結果はサンプル状態と有限状態の両方で定式化する。
論文 参考訳(メタデータ) (2022-10-03T06:09:01Z) - Near-optimal estimation of smooth transport maps with kernel
sums-of-squares [81.02564078640275]
滑らかな条件下では、2つの分布の間の正方形ワッサーシュタイン距離は、魅力的な統計的誤差上界で効率的に計算できる。
生成的モデリングのような応用への関心の対象は、基礎となる最適輸送写像である。
そこで本研究では,地図上の統計的誤差であるL2$が,既存のミニマックス下限値とほぼ一致し,スムーズな地図推定が可能となる最初のトラクタブルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-03T13:45:36Z) - Continuous Wasserstein-2 Barycenter Estimation without Minimax
Optimization [94.18714844247766]
ワッサーシュタイン・バリセンターは、最適輸送に基づく確率測度の重み付き平均の幾何学的概念を提供する。
本稿では,Wasserstein-2 バリセンタのサンプルアクセスを演算するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-02T21:01:13Z) - Efficient Interpolation of Density Estimators [23.154249845820306]
未知の密度を近似する非パラメトリック推定器の空間的および時間的効率評価の問題について検討する。
本結果は,基礎となる滑らかさの存在下でのカーネル密度推定器の高速評価に関する新しい統計的視点を与えるものである。
論文 参考訳(メタデータ) (2020-11-10T06:05:00Z) - Faster Wasserstein Distance Estimation with the Sinkhorn Divergence [0.0]
正方形ワッサーシュタイン距離(英: squared Wasserstein distance)は、非パラメトリックな設定における確率分布を比較する量である。
そこで本研究では,シンクホーンの発散量を用いて推定する手法を提案する。
滑らかな密度に対して、この推定器はサンプルの複雑さに匹敵するが、より高い正規化レベルが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-15T06:58:16Z) - $\gamma$-ABC: Outlier-Robust Approximate Bayesian Computation Based on a
Robust Divergence Estimator [95.71091446753414]
最寄りの$gamma$-divergence推定器をデータ差分尺度として用いることを提案する。
本手法は既存の不一致対策よりも高いロバスト性を実現する。
論文 参考訳(メタデータ) (2020-06-13T06:09:27Z) - Projection Robust Wasserstein Distance and Riemannian Optimization [107.93250306339694]
プロジェクション・ソリッドスタイン(PRW)は、ワッサーシュタイン・プロジェクション(WPP)のロバストな変種であることを示す。
本稿では,PRW距離の計算への第一歩として,その理論と実データに関する実験の関連について述べる。
論文 参考訳(メタデータ) (2020-06-12T20:40:22Z) - Scalable Distributed Approximation of Internal Measures for Clustering
Evaluation [5.144809478361603]
クラスタリング評価のための内部測度はシルエット係数であり、計算には2つの距離計算が必要である。
本稿では,任意の距離に基づいてクラスタリングの評価を行うための厳密な近似を計算した最初のスケーラブルアルゴリズムを提案する。
また,このアルゴリズムは凝集や分離などのクラスタリング品質の他の内部指標の厳密な近似に適応可能であることも証明した。
論文 参考訳(メタデータ) (2020-03-03T10:28:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。