論文の概要: Theoretical and computational aspects of robust optimal transportation,
with applications to statistics and machine learning
- arxiv url: http://arxiv.org/abs/2301.06297v1
- Date: Mon, 16 Jan 2023 07:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 16:28:26.137970
- Title: Theoretical and computational aspects of robust optimal transportation,
with applications to statistics and machine learning
- Title(参考訳): 頑健な最適輸送の理論的・計算的側面と統計学および機械学習への応用
- Authors: Yiming Ma, Hang Liu, Davide La Vecchia
- Abstract要約: 最適輸送理論と関連する$p$-Wasserstein距離は統計学や機械学習において一般的なツールである。
近年の研究では、OTおよび$W_p$に基づく推論は、外れ値に敏感であると指摘されている。
W_p$のロバストバージョン、すなわちロバストなワッサーシュタイン距離を定義し、アウトリージの影響を下げることができることを示す。
- 参考スコア(独自算出の注目度): 5.587390939995685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Optimal transport (OT) theory and the related $p$-Wasserstein distance
($W_p$, $p\geq 1$) are popular tools in statistics and machine learning. Recent
studies have been remarking that inference based on OT and on $W_p$ is
sensitive to outliers. To cope with this issue, we work on a robust version of
the primal OT problem (ROBOT) and show that it defines a robust version of
$W_1$, called robust Wasserstein distance, which is able to downweight the
impact of outliers. We study properties of this novel distance and use it to
define minimum distance estimators. Our novel estimators do not impose any
moment restrictions: this allows us to extend the use of OT methods to
inference on heavy-tailed distributions. We also provide statistical guarantees
of the proposed estimators. Moreover, we derive the dual form of the ROBOT and
illustrate its applicability to machine learning. Numerical exercises (see also
the supplementary material) provide evidence of the benefits yielded by our
methods.
- Abstract(参考訳): 最適輸送(ot)理論と関連する$p$-wasserstein距離(w_p$, $p\geq 1$)は、統計と機械学習で一般的なツールである。
最近の研究では、ot と $w_p$ に基づく推論は外れ値に敏感であると述べている。
この問題に対処するため、私たちは、プリマルot問題(robot)のロバストバージョンを開発し、ロバストなwaserstein距離と呼ばれる$w_1$のロバストバージョンを定義していることを示します。
我々は,この新しい距離の特性を研究し,最小距離推定器を定義する。
これにより、重い尾の分布を推定するためにOTメソッドの使用を拡張できます。
また,提案する推定器の統計的保証も提供する。
さらに,ロボットの二重形態を導出し,その機械学習への適用性を示す。
数値的なエクササイズ(補足材料も参照)は,本手法がもたらすメリットの証拠となる。
関連論文リスト
- Inverse Entropic Optimal Transport Solves Semi-supervised Learning via Data Likelihood Maximization [65.8915778873691]
条件分布は機械学習の中心的な問題です
ペアデータとペアデータの両方を統合する新しい学習パラダイムを提案する。
我々のアプローチはまた、興味深いことに逆エントロピー最適輸送(OT)と結びついている。
論文 参考訳(メタデータ) (2024-10-03T16:12:59Z) - Relative-Translation Invariant Wasserstein Distance [82.6068808353647]
距離の新しい族、相対翻訳不変ワッサーシュタイン距離(RW_p$)を導入する。
我々は、$RW_p 距離もまた、分布変換に不変な商集合 $mathcalP_p(mathbbRn)/sim$ 上で定義される実距離測度であることを示す。
論文 参考訳(メタデータ) (2024-09-04T03:41:44Z) - All You Need is Resistance: On the Equivalence of Effective Resistance and Certain Optimal Transport Problems on Graphs [48.84819106277247]
我々は、グラフ上の効果的な抵抗と最適輸送は、最大$p$を選択するまで、一つと同じものとして理解されるべきであると主張する。
最適停止時間とグラフ上のランダムウォーク,グラフソボレフ空間,ベナモ・ブレニエ型式に対する2ドルベックマン距離の明示的な接続を示す。
本稿では、ワッサーシュタイン距離が計算ボトルネックを引き起こす可能性のあるこれらの指標のさらなる利用法を提案する。
論文 参考訳(メタデータ) (2024-04-23T17:50:52Z) - Approximate Algorithms For $k$-Sparse Wasserstein Barycenter With Outliers [10.259254824702555]
我々は、外乱が存在する場合に、$k$-sparse Wasserstein Barycenter問題を研究する。
既存のWBアルゴリズムは、ケースを外れ値で処理するために直接拡張することはできない。
本稿では,外乱問題のある$k$sparse WBに対して定数近似係数を求めるクラスタリングに基づくLP法を提案する。
論文 参考訳(メタデータ) (2024-04-20T15:01:35Z) - Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - Approximate Function Evaluation via Multi-Armed Bandits [51.146684847667125]
既知の滑らかな関数 $f$ の値を未知の点 $boldsymbolmu in mathbbRn$ で推定する問題について検討する。
我々は、各座標の重要性に応じてサンプルを学習するインスタンス適応アルゴリズムを設計し、少なくとも1-delta$の確率で$epsilon$の正確な推定値である$f(boldsymbolmu)$を返す。
論文 参考訳(メタデータ) (2022-03-18T18:50:52Z) - TURF: A Two-factor, Universal, Robust, Fast Distribution Learning
Algorithm [64.13217062232874]
最も強力で成功したモダリティの1つは、全ての分布を$ell$距離に近似し、基本的に最も近い$t$-piece次数-$d_$の少なくとも1倍大きい。
本稿では,この数値をほぼ最適に推定する手法を提案する。
論文 参考訳(メタデータ) (2022-02-15T03:49:28Z) - On Unbalanced Optimal Transport: Gradient Methods, Sparsity and
Approximation Error [18.19398247972205]
我々は、少なくとも$n$の成分を持つ、おそらく異なる質量の2つの測度の間の不均衡最適輸送(UOT)について研究する。
UOT問題に対する$varepsilon$-approximateの解を求めるために,GEM-UOT(Gradient Extrapolation Method)に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-08T03:22:39Z) - Localization in 1D non-parametric latent space models from pairwise
affinities [6.982738885923206]
対の親和性から一次元トーラスにおける潜伏位置を推定する問題を考察する。
高確率でsqrtlog(n)/n$の順序の最大誤差で全ての潜伏位置を確実にローカライズする推定手順を導入する。
論文 参考訳(メタデータ) (2021-08-06T13:05:30Z) - Optimal rates for independence testing via $U$-statistic permutation
tests [7.090165638014331]
独立分布と同一分布のペアが$sigma$-finiteで分離可能な測度空間で値を取る独立性テストの問題について検討する。
最初に、独立性の有効なテストはなく、$f: D(f) geq rho2 $ という形の代替と一様に一致していることを示す。
論文 参考訳(メタデータ) (2020-01-15T19:04:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。