論文の概要: Inference via robust optimal transportation: theory and methods
- arxiv url: http://arxiv.org/abs/2301.06297v4
- Date: Thu, 29 Feb 2024 07:20:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 19:23:06.785866
- Title: Inference via robust optimal transportation: theory and methods
- Title(参考訳): 頑健な最適輸送による推論:理論と方法
- Authors: Yiming Ma, Hang Liu, Davide La Vecchia, Metthieu Lerasle
- Abstract要約: 最適輸送理論と関連する$p$-Wasserstein距離は統計学や機械学習に広く応用されている。
彼らの人気にもかかわらず、これらのツールに基づく推論にはいくつかの問題がある。
- 参考スコア(独自算出の注目度): 7.690743442192021
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Optimal transportation theory and the related $p$-Wasserstein distance
($W_p$, $p\geq 1$) are widely-applied in statistics and machine learning. In
spite of their popularity, inference based on these tools has some issues. For
instance, it is sensitive to outliers and it may not be even defined when the
underlying model has infinite moments. To cope with these problems, first we
consider a robust version of the primal transportation problem and show that it
defines the {robust Wasserstein distance}, $W^{(\lambda)}$, depending on a
tuning parameter $\lambda > 0$. Second, we illustrate the link between $W_1$
and $W^{(\lambda)}$ and study its key measure theoretic aspects. Third, we
derive some concentration inequalities for $W^{(\lambda)}$. Fourth, we use
$W^{(\lambda)}$ to define minimum distance estimators, we provide their
statistical guarantees and we illustrate how to apply the derived concentration
inequalities for a data driven selection of $\lambda$. Fifth, we provide the
{dual} form of the robust optimal transportation problem and we apply it to
machine learning problems (generative adversarial networks and domain
adaptation). Numerical exercises provide evidence of the benefits yielded by
our novel methods.
- Abstract(参考訳): 最適輸送理論と関連する$p$-ワッサーシュタイン距離(W_p$, $p\geq 1$)は統計学や機械学習に広く応用されている。
彼らの人気にもかかわらず、これらのツールに基づく推論にはいくつかの問題がある。
例えば、それは外れ値に敏感であり、基礎となるモデルが無限モーメントを持つときさえ定義されないかもしれない。
これらの問題に対処するため、まず第一に、原始輸送問題のロバストバージョンを考え、チューニングパラメータ $\lambda > 0$ に依存する {robust wasserstein distance}, $w^{(\lambda)}$ を定義する。
次に、$W_1$と$W^{(\lambda)}$の関連を説明し、その重要な測度論的な側面を研究する。
第三に、$W^{(\lambda)}$に対して濃度の不等式を導出する。
第4に、最小距離推定器を定義するために$w^{(\lambda)}$を使い、それらの統計的な保証を提供し、導出された濃度不等式を$\lambda$というデータ駆動選択に適用する方法を示す。
第5に、ロバストな最適輸送問題のdual形式を提供し、これを機械学習問題(生成的対向ネットワークとドメイン適応)に適用する。
数値的な演習は、我々の新しい方法によって得られる利点の証拠を提供する。
関連論文リスト
- Inverse Entropic Optimal Transport Solves Semi-supervised Learning via Data Likelihood Maximization [65.8915778873691]
条件分布は機械学習の中心的な問題です
ペアデータとペアデータの両方を統合する新しい学習パラダイムを提案する。
我々のアプローチはまた、興味深いことに逆エントロピー最適輸送(OT)と結びついている。
論文 参考訳(メタデータ) (2024-10-03T16:12:59Z) - Relative-Translation Invariant Wasserstein Distance [82.6068808353647]
距離の新しい族、相対翻訳不変ワッサーシュタイン距離(RW_p$)を導入する。
我々は、$RW_p 距離もまた、分布変換に不変な商集合 $mathcalP_p(mathbbRn)/sim$ 上で定義される実距離測度であることを示す。
論文 参考訳(メタデータ) (2024-09-04T03:41:44Z) - All You Need is Resistance: On the Equivalence of Effective Resistance and Certain Optimal Transport Problems on Graphs [48.84819106277247]
我々は、グラフ上の効果的な抵抗と最適輸送は、最大$p$を選択するまで、一つと同じものとして理解されるべきであると主張する。
最適停止時間とグラフ上のランダムウォーク,グラフソボレフ空間,ベナモ・ブレニエ型式に対する2ドルベックマン距離の明示的な接続を示す。
本稿では、ワッサーシュタイン距離が計算ボトルネックを引き起こす可能性のあるこれらの指標のさらなる利用法を提案する。
論文 参考訳(メタデータ) (2024-04-23T17:50:52Z) - Approximate Algorithms For $k$-Sparse Wasserstein Barycenter With Outliers [10.259254824702555]
我々は、外乱が存在する場合に、$k$-sparse Wasserstein Barycenter問題を研究する。
既存のWBアルゴリズムは、ケースを外れ値で処理するために直接拡張することはできない。
本稿では,外乱問題のある$k$sparse WBに対して定数近似係数を求めるクラスタリングに基づくLP法を提案する。
論文 参考訳(メタデータ) (2024-04-20T15:01:35Z) - Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - Approximate Function Evaluation via Multi-Armed Bandits [51.146684847667125]
既知の滑らかな関数 $f$ の値を未知の点 $boldsymbolmu in mathbbRn$ で推定する問題について検討する。
我々は、各座標の重要性に応じてサンプルを学習するインスタンス適応アルゴリズムを設計し、少なくとも1-delta$の確率で$epsilon$の正確な推定値である$f(boldsymbolmu)$を返す。
論文 参考訳(メタデータ) (2022-03-18T18:50:52Z) - TURF: A Two-factor, Universal, Robust, Fast Distribution Learning
Algorithm [64.13217062232874]
最も強力で成功したモダリティの1つは、全ての分布を$ell$距離に近似し、基本的に最も近い$t$-piece次数-$d_$の少なくとも1倍大きい。
本稿では,この数値をほぼ最適に推定する手法を提案する。
論文 参考訳(メタデータ) (2022-02-15T03:49:28Z) - On Unbalanced Optimal Transport: Gradient Methods, Sparsity and
Approximation Error [18.19398247972205]
我々は、少なくとも$n$の成分を持つ、おそらく異なる質量の2つの測度の間の不均衡最適輸送(UOT)について研究する。
UOT問題に対する$varepsilon$-approximateの解を求めるために,GEM-UOT(Gradient Extrapolation Method)に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-08T03:22:39Z) - Localization in 1D non-parametric latent space models from pairwise
affinities [6.982738885923206]
対の親和性から一次元トーラスにおける潜伏位置を推定する問題を考察する。
高確率でsqrtlog(n)/n$の順序の最大誤差で全ての潜伏位置を確実にローカライズする推定手順を導入する。
論文 参考訳(メタデータ) (2021-08-06T13:05:30Z) - Optimal rates for independence testing via $U$-statistic permutation
tests [7.090165638014331]
独立分布と同一分布のペアが$sigma$-finiteで分離可能な測度空間で値を取る独立性テストの問題について検討する。
最初に、独立性の有効なテストはなく、$f: D(f) geq rho2 $ という形の代替と一様に一致していることを示す。
論文 参考訳(メタデータ) (2020-01-15T19:04:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。