論文の概要: A New Robust Partial $p$-Wasserstein-Based Metric for Comparing Distributions
- arxiv url: http://arxiv.org/abs/2405.03664v1
- Date: Mon, 6 May 2024 17:41:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-07 12:57:40.728205
- Title: A New Robust Partial $p$-Wasserstein-Based Metric for Comparing Distributions
- Title(参考訳): 分布比較のための新しいロバスト部分$p$-Wasserstein-based Metric
- Authors: Sharath Raghvendra, Pouyan Shirzadian, Kaiyi Zhang,
- Abstract要約: 我々は,約2ドルのワッサーシュタイン距離の計算に基づく,$k$-RPWと呼ばれる,$k ge 0$でパラメータ化された新しい距離の族を導入する。
- 参考スコア(独自算出の注目度): 8.176521989807748
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The $2$-Wasserstein distance is sensitive to minor geometric differences between distributions, making it a very powerful dissimilarity metric. However, due to this sensitivity, a small outlier mass can also cause a significant increase in the $2$-Wasserstein distance between two similar distributions. Similarly, sampling discrepancy can cause the empirical $2$-Wasserstein distance on $n$ samples in $\mathbb{R}^2$ to converge to the true distance at a rate of $n^{-1/4}$, which is significantly slower than the rate of $n^{-1/2}$ for $1$-Wasserstein distance. We introduce a new family of distances parameterized by $k \ge 0$, called $k$-RPW, that is based on computing the partial $2$-Wasserstein distance. We show that (1) $k$-RPW satisfies the metric properties, (2) $k$-RPW is robust to small outlier mass while retaining the sensitivity of $2$-Wasserstein distance to minor geometric differences, and (3) when $k$ is a constant, $k$-RPW distance between empirical distributions on $n$ samples in $\mathbb{R}^2$ converges to the true distance at a rate of $n^{-1/3}$, which is faster than the convergence rate of $n^{-1/4}$ for the $2$-Wasserstein distance. Using the partial $p$-Wasserstein distance, we extend our distance to any $p \in [1,\infty]$. By setting parameters $k$ or $p$ appropriately, we can reduce our distance to the total variation, $p$-Wasserstein, and the L\'evy-Prokhorov distances. Experiments show that our distance function achieves higher accuracy in comparison to the $1$-Wasserstein, $2$-Wasserstein, and TV distances for image retrieval tasks on noisy real-world data sets.
- Abstract(参考訳): 2ドルのワッサーシュタイン距離は、分布間の微妙な幾何学的差異に敏感であり、非常に強力な相似性計量である。
我々は,部分的な2ドルワッサーシュタイン距離の計算に基づいて,$k$-RPWと呼ばれる$k \ge 0$でパラメータ化された新しい距離の族を導入する。
1)$k$-RPW が計量特性を満たすこと、(2)$k$-RPW が小さな外れ値質量に対して頑健であること、(3)$k$ が定数であるとき、$k$-RPW は$\mathbb{R}^2$ のサンプル上の経験的分布の間の距離が$n^{-1/3}$ の速度で真の距離に収束することを示し、これは$n^{-1/4} の収束速度よりも速い。
部分的な$p$-ワッサーシュタイン距離を用いて、我々の距離を任意の$p \in [1,\infty]$に拡張する。
パラメータ $k$ または $p$ を適切に設定することで、総変量、$p$-ワッサーシュタイン、L'evy-Prokhorov 距離までの距離を減らすことができる。
- Mean and Variance Estimation Complexity in Arbitrary Distributions via Wasserstein Minimization [0.0]
MLE(Maximum Likelihood Estimation)ではNPハードとなるが、$varepsilon$-approxs for arbitrary $varepsilon > 0$ in $textpoly left( frac1varepsilon )$ time が得られる。
論文 参考訳(メタデータ) (2025-01-17T13:07:52Z) - Dimension-free Private Mean Estimation for Anisotropic Distributions [55.86374912608193]
論文 参考訳(メタデータ) (2024-11-01T17:59:53Z) - Relative-Translation Invariant Wasserstein Distance [82.6068808353647]
我々は、$RW_p 距離もまた、分布変換に不変な商集合 $mathcalP_p(mathbbRn)/sim$ 上で定義される実距離測度であることを示す。
論文 参考訳(メタデータ) (2024-09-04T03:41:44Z) - Optimal bounds for $\ell_p$ sensitivity sampling via $\ell_2$ augmentation [56.403488578703865]
我々は$ell$ Sensitivities を $ell$ Sensitivities で拡張することにより、最適な線形 $tilde O(varepsilon-2mu2 d)$ サンプリング複雑性のより良い境界が得られることを示した。
また、ロジスティック回帰のために、$tilde O(varepsilon-2mu2 d)$ sensitivity sample bound を得る。
論文 参考訳(メタデータ) (2024-06-01T07:03:40Z) - $\ell_p$-Regression in the Arbitrary Partition Model of Communication [59.89387020011663]
p = 2$、すなわち最小二乗回帰の場合、$tildeTheta(sd2 + sd/epsilon)$ bitsの最初の最適境界を与える。
p in (1,2)$ に対して、$tildeO(sd2/epsilon + sd/mathrmpoly(epsilon)$ upper bound を得る。
論文 参考訳(メタデータ) (2023-07-11T08:51:53Z) - Beyond Moments: Robustly Learning Affine Transformations with
Asymptotically Optimal Error [8.615625517708324]
論文 参考訳(メタデータ) (2023-02-23T19:13:30Z) - The quantum low-rank approximation problem [0.0]
この距離を最小化する最適状態 $sigma$ を解析的に解く。
論文 参考訳(メタデータ) (2022-03-02T01:05:01Z) - TURF: A Two-factor, Universal, Robust, Fast Distribution Learning
Algorithm [64.13217062232874]
論文 参考訳(メタデータ) (2022-02-15T03:49:28Z) - Sampling from Log-Concave Distributions with Infinity-Distance
Guarantees and Applications to Differentially Private Optimization [33.38289436686841]
本稿では,dis distributionO(varepsilon)$close から$ infinity-distance に点を出力するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-07T13:44:50Z) - Few-Shot Learning via Learning the Representation, Provably [115.7367053639605]
論文 参考訳(メタデータ) (2020-02-21T17:30:00Z)