論文の概要: Theoretical and computational aspects of robust optimal transportation,
with applications to statistics and machine learning
- arxiv url: http://arxiv.org/abs/2301.06297v1
- Date: Mon, 16 Jan 2023 07:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 16:28:26.137970
- Title: Theoretical and computational aspects of robust optimal transportation,
with applications to statistics and machine learning
- Title(参考訳): 頑健な最適輸送の理論的・計算的側面と統計学および機械学習への応用
- Authors: Yiming Ma, Hang Liu, Davide La Vecchia
- Abstract要約: 最適輸送理論と関連する$p$-Wasserstein距離は統計学や機械学習において一般的なツールである。
近年の研究では、OTおよび$W_p$に基づく推論は、外れ値に敏感であると指摘されている。
W_p$のロバストバージョン、すなわちロバストなワッサーシュタイン距離を定義し、アウトリージの影響を下げることができることを示す。
- 参考スコア(独自算出の注目度): 5.587390939995685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Optimal transport (OT) theory and the related $p$-Wasserstein distance
($W_p$, $p\geq 1$) are popular tools in statistics and machine learning. Recent
studies have been remarking that inference based on OT and on $W_p$ is
sensitive to outliers. To cope with this issue, we work on a robust version of
the primal OT problem (ROBOT) and show that it defines a robust version of
$W_1$, called robust Wasserstein distance, which is able to downweight the
impact of outliers. We study properties of this novel distance and use it to
define minimum distance estimators. Our novel estimators do not impose any
moment restrictions: this allows us to extend the use of OT methods to
inference on heavy-tailed distributions. We also provide statistical guarantees
of the proposed estimators. Moreover, we derive the dual form of the ROBOT and
illustrate its applicability to machine learning. Numerical exercises (see also
the supplementary material) provide evidence of the benefits yielded by our
methods.
- Abstract(参考訳): 最適輸送(ot)理論と関連する$p$-wasserstein距離(w_p$, $p\geq 1$)は、統計と機械学習で一般的なツールである。
最近の研究では、ot と $w_p$ に基づく推論は外れ値に敏感であると述べている。
この問題に対処するため、私たちは、プリマルot問題(robot)のロバストバージョンを開発し、ロバストなwaserstein距離と呼ばれる$w_1$のロバストバージョンを定義していることを示します。
我々は,この新しい距離の特性を研究し,最小距離推定器を定義する。
これにより、重い尾の分布を推定するためにOTメソッドの使用を拡張できます。
また,提案する推定器の統計的保証も提供する。
さらに,ロボットの二重形態を導出し,その機械学習への適用性を示す。
数値的なエクササイズ(補足材料も参照)は,本手法がもたらすメリットの証拠となる。
関連論文リスト
- Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - Sparse Gaussian Graphical Models with Discrete Optimization:
Computational and Statistical Perspectives [8.403841349300103]
本研究では,無向ガウス図形モデルに基づくスパースグラフの学習問題を考察する。
擬似微分関数の $ell_0$-penalized バージョンに基づく新しい推定器 GraphL0BnB を提案する。
実/合成データセットに関する数値実験により,本手法がほぼ最適に,p = 104$の問題を解けることが示唆された。
論文 参考訳(メタデータ) (2023-07-18T15:49:02Z) - Learning Costs for Structured Monge Displacements [36.07140689022009]
最適輸送理論は、サンプルから密度の間のプッシュフォワードマップを推測するいくつかのツールを機械学習に提供した。
既存のアプローチは、地上コストとして単純な2乗ユークリッド距離でそのような写像を推定するというデフォルトの選択肢から外れることは滅多にない。
そこで本稿では, 直交勾配勾配下降を基礎として, 構造的コストを考慮し, 地中真理輸送を生成する手法を提案する。
論文 参考訳(メタデータ) (2023-06-20T21:17:32Z) - Pseudonorm Approachability and Applications to Regret Minimization [73.54127663296906]
我々は、高次元 $ell_infty$-approachability 問題を、低次元の擬ノルムアプローチ可能性問題に変換する。
我々は、$ell$や他のノルムに対するアプローチ可能性に関する以前の研究に類似した疑似ノルムアプローチ可能性のアルゴリズム理論を開発する。
論文 参考訳(メタデータ) (2023-02-03T03:19:14Z) - Supervised Training of Conditional Monge Maps [107.78770597815242]
最適輸送(OT)理論は、多くの可能な選択の中から確率測度を他のものにマッピングする最も効率的な方法を定義し、選択する一般的な原理を記述している。
本研究では,コンテキスト変数に条件付きOTマップの族を推定するマルチタスク手法であるCondOTを紹介する。
本研究では,CondOTの遺伝的・治療的摂動の任意の組み合わせが単一細胞に与える影響を推測する能力を示す。
論文 参考訳(メタデータ) (2022-06-28T19:34:44Z) - Approximate Function Evaluation via Multi-Armed Bandits [51.146684847667125]
既知の滑らかな関数 $f$ の値を未知の点 $boldsymbolmu in mathbbRn$ で推定する問題について検討する。
我々は、各座標の重要性に応じてサンプルを学習するインスタンス適応アルゴリズムを設計し、少なくとも1-delta$の確率で$epsilon$の正確な推定値である$f(boldsymbolmu)$を返す。
論文 参考訳(メタデータ) (2022-03-18T18:50:52Z) - TURF: A Two-factor, Universal, Robust, Fast Distribution Learning
Algorithm [64.13217062232874]
最も強力で成功したモダリティの1つは、全ての分布を$ell$距離に近似し、基本的に最も近い$t$-piece次数-$d_$の少なくとも1倍大きい。
本稿では,この数値をほぼ最適に推定する手法を提案する。
論文 参考訳(メタデータ) (2022-02-15T03:49:28Z) - On Unbalanced Optimal Transport: Gradient Methods, Sparsity and
Approximation Error [18.19398247972205]
我々は、少なくとも$n$の成分を持つ、おそらく異なる質量の2つの測度の間の不均衡最適輸送(UOT)について研究する。
UOT問題に対する$varepsilon$-approximateの解を求めるために,GEM-UOT(Gradient Extrapolation Method)に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-08T03:22:39Z) - Localization in 1D non-parametric latent space models from pairwise
affinities [6.982738885923206]
対の親和性から一次元トーラスにおける潜伏位置を推定する問題を考察する。
高確率でsqrtlog(n)/n$の順序の最大誤差で全ての潜伏位置を確実にローカライズする推定手順を導入する。
論文 参考訳(メタデータ) (2021-08-06T13:05:30Z) - Mediated Uncoupled Learning: Learning Functions without Direct
Input-output Correspondences [80.95776331769899]
ペア化されたデータがない場合、$X$から$Y$を予測するタスクを考えます。
単純なアプローチは、$S_X$で$U$から$U$を予測し、$S_Y$で$U$から$Y$を予測することである。
我々は$U$を予測しない新しい方法を提案するが、$f(X)$と$S_X$をトレーニングすることで$Y = f(X)$を直接学習し、$h(U)$を予測する。
論文 参考訳(メタデータ) (2021-07-16T22:13:29Z) - Optimal rates for independence testing via $U$-statistic permutation
tests [7.090165638014331]
独立分布と同一分布のペアが$sigma$-finiteで分離可能な測度空間で値を取る独立性テストの問題について検討する。
最初に、独立性の有効なテストはなく、$f: D(f) geq rho2 $ という形の代替と一様に一致していることを示す。
論文 参考訳(メタデータ) (2020-01-15T19:04:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。