論文の概要: Optimal Transport with Heterogeneously Missing Data
- arxiv url: http://arxiv.org/abs/2505.17291v1
- Date: Thu, 22 May 2025 21:16:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.696811
- Title: Optimal Transport with Heterogeneously Missing Data
- Title(参考訳): 不均一なデータによる最適輸送
- Authors: Linus Bleistein, Aurélien Bellet, Julie Josse,
- Abstract要約: 本稿では,2つの経験的分布間の最適輸送問題の解法について考察する。
実験的な分布と線形モンジュ写像の間のワッサーシュタイン距離は, 試料の複雑さに大きな影響を及ぼすことなく, 縮退することができることを示す。
- 参考スコア(独自算出の注目度): 12.896319628045967
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of solving the optimal transport problem between two empirical distributions with missing values. Our main assumption is that the data is missing completely at random (MCAR), but we allow for heterogeneous missingness probabilities across features and across the two distributions. As a first contribution, we show that the Wasserstein distance between empirical Gaussian distributions and linear Monge maps between arbitrary distributions can be debiased without significantly affecting the sample complexity. Secondly, we show that entropic regularized optimal transport can be estimated efficiently and consistently using iterative singular value thresholding (ISVT). We propose a validation set-free hyperparameter selection strategy for ISVT that leverages our estimator of the Bures-Wasserstein distance, which could be of independent interest in general matrix completion problems. Finally, we validate our findings on a wide range of numerical applications.
- Abstract(参考訳): 本稿では,2つの経験的分布間の最適輸送問題の解法について考察する。
主な前提は、データが完全にランダムに欠落している(MCAR)が、特徴と2つの分布にまたがる不均一な欠落確率を許容する。
最初の貢献として、実験的なガウス分布と任意の分布の間の線型モンジュ写像の間のワッサーシュタイン距離が、サンプルの複雑さに大きな影響を及ぼすことなくデバイアス化できることが示される。
第二に、エントロピー正則化最適輸送は、反復特異値しきい値(ISVT)を用いて効率よく、一貫して推定できることを示す。
一般行列完備化問題に独立して関心を持つ可能性のあるBures-Wasserstein距離推定器を利用するISVTの検証自由なハイパーパラメータ選択戦略を提案する。
最後に, 幅広い数値的応用の検証を行った。
関連論文リスト
- On the Wasserstein Convergence and Straightness of Rectified Flow [54.580605276017096]
Rectified Flow (RF) は、ノイズからデータへの直流軌跡の学習を目的とした生成モデルである。
RFのサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する理論的解析を行った。
本稿では,従来の経験的知見と一致した1-RFの特異性と直線性を保証する一般的な条件について述べる。
論文 参考訳(メタデータ) (2024-10-19T02:36:11Z) - Distributional Matrix Completion via Nearest Neighbors in the Wasserstein Space [8.971989179518216]
わずかに観察された経験的分布の行列を考えると、観測された行列と観測されていない行列の両方に関連する真の分布をインプットしようと試みる。
最適輸送のツールを用いて、最も近い隣人法を分布設定に一般化する。
論文 参考訳(メタデータ) (2024-10-17T00:50:17Z) - Computing the Distance between unbalanced Distributions -- The flat
Metric [0.0]
平坦計量は、よく知られたワッサーシュタイン距離 W1 を、分布が不等質量である場合に一般化する。
この手法のコアはニューラルネットワークに基づいて、2つの測度間の距離を実現する最適なテスト関数を決定する。
論文 参考訳(メタデータ) (2023-08-02T09:30:22Z) - Minimax estimation of discontinuous optimal transport maps: The
semi-discrete case [14.333765302506658]
2つの確率分布、$P$ および $Q$ in $mathbb Rd$ の間の最適輸送写像を推定する問題を考える。
エントロピックな最適輸送に基づく推定器は、次元に依存しないミニマックス最適速度$n-1/2$で収束することを示す。
論文 参考訳(メタデータ) (2023-01-26T18:41:38Z) - Near-optimal estimation of smooth transport maps with kernel
sums-of-squares [81.02564078640275]
滑らかな条件下では、2つの分布の間の正方形ワッサーシュタイン距離は、魅力的な統計的誤差上界で効率的に計算できる。
生成的モデリングのような応用への関心の対象は、基礎となる最適輸送写像である。
そこで本研究では,地図上の統計的誤差であるL2$が,既存のミニマックス下限値とほぼ一致し,スムーズな地図推定が可能となる最初のトラクタブルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-03T13:45:36Z) - Semi-Discrete Optimal Transport: Hardness, Regularization and Numerical
Solution [8.465228064780748]
2つの点でサポートされる離散確率測度の間のWasserstein距離の計算が既に#P-hardであることを証明します。
目的関数が最も悪質な外乱分布で滑らかになる分布的に頑健な双対最適輸送問題を導入する。
双対目的関数の平滑化は主目的関数の正則化と等価であることを示す。
論文 参考訳(メタデータ) (2021-03-10T18:53:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。