論文の概要: Optimal Transport with Heterogeneously Missing Data
- arxiv url: http://arxiv.org/abs/2505.17291v1
- Date: Thu, 22 May 2025 21:16:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.696811
- Title: Optimal Transport with Heterogeneously Missing Data
- Title(参考訳): 不均一なデータによる最適輸送
- Authors: Linus Bleistein, Aurélien Bellet, Julie Josse,
- Abstract要約: 本稿では,2つの経験的分布間の最適輸送問題の解法について考察する。
実験的な分布と線形モンジュ写像の間のワッサーシュタイン距離は, 試料の複雑さに大きな影響を及ぼすことなく, 縮退することができることを示す。
- 参考スコア(独自算出の注目度): 12.896319628045967
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of solving the optimal transport problem between two empirical distributions with missing values. Our main assumption is that the data is missing completely at random (MCAR), but we allow for heterogeneous missingness probabilities across features and across the two distributions. As a first contribution, we show that the Wasserstein distance between empirical Gaussian distributions and linear Monge maps between arbitrary distributions can be debiased without significantly affecting the sample complexity. Secondly, we show that entropic regularized optimal transport can be estimated efficiently and consistently using iterative singular value thresholding (ISVT). We propose a validation set-free hyperparameter selection strategy for ISVT that leverages our estimator of the Bures-Wasserstein distance, which could be of independent interest in general matrix completion problems. Finally, we validate our findings on a wide range of numerical applications.
- Abstract(参考訳): 本稿では,2つの経験的分布間の最適輸送問題の解法について考察する。
主な前提は、データが完全にランダムに欠落している(MCAR)が、特徴と2つの分布にまたがる不均一な欠落確率を許容する。
最初の貢献として、実験的なガウス分布と任意の分布の間の線型モンジュ写像の間のワッサーシュタイン距離が、サンプルの複雑さに大きな影響を及ぼすことなくデバイアス化できることが示される。
第二に、エントロピー正則化最適輸送は、反復特異値しきい値(ISVT)を用いて効率よく、一貫して推定できることを示す。
一般行列完備化問題に独立して関心を持つ可能性のあるBures-Wasserstein距離推定器を利用するISVTの検証自由なハイパーパラメータ選択戦略を提案する。
最後に, 幅広い数値的応用の検証を行った。
関連論文リスト
- Sublinear Algorithms for Wasserstein and Total Variation Distances: Applications to Fairness and Privacy Auditing [7.81603404636933]
Weibull の確率および累積分布関数 (PDF と CDF) を学習するための汎用フレームワークを提案する。
我々は,サブ線形空間のみを必要としながら,サンプルストリームからの分布のマージ可能な要約を計算する。
提案アルゴリズムは,超線形時間と線形空間の複素量による距離推定手法を改良した。
論文 参考訳(メタデータ) (2025-03-10T18:57:48Z) - Towards Self-Supervised Covariance Estimation in Deep Heteroscedastic Regression [102.24287051757469]
深部異方性回帰における自己教師付き共分散推定について検討する。
正規分布の間の2-ワッサーシュタイン距離の上界を導出する。
幅広い合成データセットと実データセットに対する実験により、提案された2-ワッサーシュタインと擬似ラベルアノテーションが結合した結果、計算的に安価で正確な深部ヘテロ代用回帰が導かれることが示された。
論文 参考訳(メタデータ) (2025-02-14T22:37:11Z) - On the Wasserstein Convergence and Straightness of Rectified Flow [54.580605276017096]
Rectified Flow (RF) は、ノイズからデータへの直流軌跡の学習を目的とした生成モデルである。
RFのサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する理論的解析を行った。
本稿では,従来の経験的知見と一致した1-RFの特異性と直線性を保証する一般的な条件について述べる。
論文 参考訳(メタデータ) (2024-10-19T02:36:11Z) - Distributional Matrix Completion via Nearest Neighbors in the Wasserstein Space [8.971989179518216]
わずかに観察された経験的分布の行列を考えると、観測された行列と観測されていない行列の両方に関連する真の分布をインプットしようと試みる。
最適輸送のツールを用いて、最も近い隣人法を分布設定に一般化する。
論文 参考訳(メタデータ) (2024-10-17T00:50:17Z) - Computing the Distance between unbalanced Distributions -- The flat
Metric [0.0]
平坦計量は、よく知られたワッサーシュタイン距離 W1 を、分布が不等質量である場合に一般化する。
この手法のコアはニューラルネットワークに基づいて、2つの測度間の距離を実現する最適なテスト関数を決定する。
論文 参考訳(メタデータ) (2023-08-02T09:30:22Z) - Approximating a RUM from Distributions on k-Slates [88.32814292632675]
与えられた分布を平均で最もよく近似するRUMを求める一般化時間アルゴリズムを求める。
我々の理論的結果は、実世界のデータセットに効果的でスケール可能なものを得るという、実践的な結果も得られます。
論文 参考訳(メタデータ) (2023-05-22T17:43:34Z) - Minimax estimation of discontinuous optimal transport maps: The
semi-discrete case [14.333765302506658]
2つの確率分布、$P$ および $Q$ in $mathbb Rd$ の間の最適輸送写像を推定する問題を考える。
エントロピックな最適輸送に基づく推定器は、次元に依存しないミニマックス最適速度$n-1/2$で収束することを示す。
論文 参考訳(メタデータ) (2023-01-26T18:41:38Z) - Optimal Efficiency-Envy Trade-Off via Optimal Transport [33.85971515753188]
本論では,各受取人に対して,各受取人に対して,各受取人に対して,各受取人に対して一定かつ所定の割合のアイテムを割り当てなければならないという問題を考察する。
この問題は半離散的最適輸送(OT)問題の変種として定式化でき、その場合の解構造は簡潔な表現と単純な幾何学的解釈を持つ。
論文 参考訳(メタデータ) (2022-09-25T00:39:43Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Near-optimal estimation of smooth transport maps with kernel
sums-of-squares [81.02564078640275]
滑らかな条件下では、2つの分布の間の正方形ワッサーシュタイン距離は、魅力的な統計的誤差上界で効率的に計算できる。
生成的モデリングのような応用への関心の対象は、基礎となる最適輸送写像である。
そこで本研究では,地図上の統計的誤差であるL2$が,既存のミニマックス下限値とほぼ一致し,スムーズな地図推定が可能となる最初のトラクタブルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-03T13:45:36Z) - Semi-Discrete Optimal Transport: Hardness, Regularization and Numerical
Solution [8.465228064780748]
2つの点でサポートされる離散確率測度の間のWasserstein距離の計算が既に#P-hardであることを証明します。
目的関数が最も悪質な外乱分布で滑らかになる分布的に頑健な双対最適輸送問題を導入する。
双対目的関数の平滑化は主目的関数の正則化と等価であることを示す。
論文 参考訳(メタデータ) (2021-03-10T18:53:59Z) - Variational Transport: A Convergent Particle-BasedAlgorithm for Distributional Optimization [106.70006655990176]
分散最適化問題は機械学習や統計学で広く発生する。
本稿では,変分輸送と呼ばれる粒子に基づく新しいアルゴリズムを提案する。
目的関数がpolyak-Lojasiewicz (PL) (Polyak, 1963) の機能バージョンと滑らかな条件を満たすとき、変分輸送は線形に収束することを示す。
論文 参考訳(メタデータ) (2020-12-21T18:33:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。