論文の概要: Robust Estimation under the Wasserstein Distance
- arxiv url: http://arxiv.org/abs/2302.01237v1
- Date: Thu, 2 Feb 2023 17:20:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-03 13:06:31.910003
- Title: Robust Estimation under the Wasserstein Distance
- Title(参考訳): Wasserstein距離におけるロバスト推定
- Authors: Sloan Nietert, Rachel Cummings, and Ziv Goldfeld
- Abstract要約: 出力分布から外周質量が$varepsilon$を除去できる新しい外周ローバストワッサーシュタイン距離$mathsfW_pvarepsilon$を導入する。
我々は,$mathsfW_pvarepsilon$で最小距離推定を行うことで,最小限のロバスト推定リスクが得られることを示した。
- 参考スコア(独自算出の注目度): 28.792608997509376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of robust distribution estimation under the Wasserstein
metric, a popular discrepancy measure between probability distributions rooted
in optimal transport (OT) theory. We introduce a new outlier-robust Wasserstein
distance $\mathsf{W}_p^\varepsilon$ which allows for $\varepsilon$ outlier mass
to be removed from its input distributions, and show that minimum distance
estimation under $\mathsf{W}_p^\varepsilon$ achieves minimax optimal robust
estimation risk. Our analysis is rooted in several new results for partial OT,
including an approximate triangle inequality, which may be of independent
interest. To address computational tractability, we derive a dual formulation
for $\mathsf{W}_p^\varepsilon$ that adds a simple penalty term to the classic
Kantorovich dual objective. As such, $\mathsf{W}_p^\varepsilon$ can be
implemented via an elementary modification to standard, duality-based OT
solvers. Our results are extended to sliced OT, where distributions are
projected onto low-dimensional subspaces, and applications to homogeneity and
independence testing are explored. We illustrate the virtues of our framework
via applications to generative modeling with contaminated datasets.
- Abstract(参考訳): 最適輸送(OT)理論に根ざした確率分布間の一般的な相違尺度であるワッサーシュタイン計量の下でのロバスト分布推定の問題を考察する。
本研究では,入力分布から$\varepsilon$outlier massを除去できる新しいoutlier-robust wasserstein distance $\mathsf{w}_p^\varepsilon$を導入し,$\mathsf{w}_p^\varepsilon$以下の最小距離推定が最小の最適ロバストな推定リスクを達成することを示す。
解析は, 独立興味を持つ近似三角不等式を含む, 部分 ot に対するいくつかの新しい結果に根ざしている。
計算的トラクタビリティに対処するために、古典的カントロビッチ双対目的に単純なペナルティ項を与える$\mathsf{W}_p^\varepsilon$の双対定式を導出する。
したがって、$\mathsf{W}_p^\varepsilon$ は標準双対型OTソルバへの基本的な修正によって実装できる。
その結果,低次元部分空間に分布を投影するスライスotに拡張され,同質性と独立性テストへの応用が検討された。
汚染されたデータセットを用いた生成モデリングへのアプリケーションを通して、我々のフレームワークの長所を説明します。
関連論文リスト
- Near Minimax-Optimal Distributional Temporal Difference Algorithms and The Freedman Inequality in Hilbert Spaces [24.03281329962804]
我々は,非パラメトリック分布型TDアルゴリズム (NTD) を$gamma$-discounted infinite-horizon Markov決定プロセスに対して提案する。
我々はヒルベルト空間における新しいフリードマンの不等式を確立し、これは独立な関心事である。
論文 参考訳(メタデータ) (2024-03-09T06:19:53Z) - Better and Simpler Lower Bounds for Differentially Private Statistical
Estimation [7.693388437377614]
任意の$alpha le O(1)$に対して、ガウスの共分散をスペクトル誤差まで推定するには$tildeOmegaleft(fracd3/2alpha varepsilon + fracdalpha2right)$サンプルが必要である。
次に、有界な$k$thモーメントで重み付き分布の平均を推定するには$tildeOmegaleft(fracdalphak/(k-1) varepsilon +
論文 参考訳(メタデータ) (2023-10-10T04:02:43Z) - Robust computation of optimal transport by $\beta$-potential
regularization [79.24513412588745]
最適輸送(OT)は、確率分布間の差を測定する機械学習分野で広く使われているツールである。
我々は、いわゆる$beta$-divergenceに付随するベータポテンシャル項でOTを正規化することを提案する。
提案アルゴリズムで計算した輸送行列は,外乱が存在する場合でも確率分布を頑健に推定するのに役立つことを実験的に実証した。
論文 参考訳(メタデータ) (2022-12-26T18:37:28Z) - Near Sample-Optimal Reduction-based Policy Learning for Average Reward
MDP [58.13930707612128]
この研究は、平均報酬マルコフ決定過程(AMDP)における$varepsilon$-Optimal Policyを得る際のサンプルの複雑さを考察する。
我々は、状態-作用対当たりの$widetilde O(H varepsilon-3 ln frac1delta)$サンプルを証明し、$H := sp(h*)$は任意の最適ポリシーのバイアスのスパンであり、$varepsilon$は精度、$delta$は失敗確率である。
論文 参考訳(メタデータ) (2022-12-01T15:57:58Z) - The Sketched Wasserstein Distance for mixture distributions [13.643197515573029]
スケッチド・ワッサースタイン距離(英: Sketched Wasserstein Distance)(WS$)は、有限混合分布に特化された新しい確率距離である。
我々は、$WS$が、$mathcalS = textrmconv(mathcalA)$ の要素の混合の空間に最も区別できるものとして定義されることを示す。
論文 参考訳(メタデータ) (2022-06-26T02:33:40Z) - A Law of Robustness beyond Isoperimetry [84.33752026418045]
我々は、任意の分布上でニューラルネットワークパラメータを補間する頑健性の低い$Omega(sqrtn/p)$を証明した。
次に、$n=mathrmpoly(d)$のとき、スムーズなデータに対する過度なパラメータ化の利点を示す。
我々は、$n=exp(omega(d))$ のとき、$O(1)$-Lipschitz の頑健な補間関数の存在を否定する。
論文 参考訳(メタデータ) (2022-02-23T16:10:23Z) - Outlier-Robust Optimal Transport: Duality, Structure, and Statistical
Applications [25.410110072480187]
ワッサーシュタイン距離は、考慮された分布における外れ値に敏感である。
本稿では, 汚染された各分布から, $varepsilon$outlier mass を除去できる新しいoutlier-robust Wasserstein distance $mathsfW_pvarepsilon$を提案する。
論文 参考訳(メタデータ) (2021-11-02T04:05:45Z) - Wasserstein distance estimates for the distributions of numerical
approximations to ergodic stochastic differential equations [0.3553493344868413]
エルゴード微分方程式のイン分布と強い対数凸の場合の分布との間のワッサースタイン距離について検討した。
これにより、過減衰および過減衰ランジュバン力学の文献で提案されている多くの異なる近似を統一的に研究することができる。
論文 参考訳(メタデータ) (2021-04-26T07:50:04Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z) - On Projection Robust Optimal Transport: Sample Complexity and Model
Misspecification [101.0377583883137]
射影ロバスト(PR)OTは、2つの測度の間のOTコストを最大化するために、射影可能な$k$次元部分空間を選択する。
私たちの最初の貢献は、PRワッサーシュタイン距離のいくつかの基本的な統計的性質を確立することである。
次に、部分空間を最適化するのではなく平均化することにより、PRW距離の代替として積分PRワッサーシュタイン距離(IPRW)を提案する。
論文 参考訳(メタデータ) (2020-06-22T14:35:33Z) - Learning Halfspaces with Tsybakov Noise [50.659479930171585]
テュバコフ雑音の存在下でのハーフスペースの学習可能性について検討する。
真半空間に関して誤分類誤差$epsilon$を達成するアルゴリズムを与える。
論文 参考訳(メタデータ) (2020-06-11T14:25:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。