論文の概要: Geometry-Aware Optimal Transport: Fast Intrinsic Dimension and Wasserstein Distance Estimation
- arxiv url: http://arxiv.org/abs/2602.04335v1
- Date: Wed, 04 Feb 2026 08:56:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.440928
- Title: Geometry-Aware Optimal Transport: Fast Intrinsic Dimension and Wasserstein Distance Estimation
- Title(参考訳): 幾何を考慮した最適輸送:高速固有次元とワッサーシュタイン距離推定
- Authors: Ferdinand Genans, Olivier Wintenberger,
- Abstract要約: 我々は,半双対OT関数を利用する$textOT_c(, hat)$のチューニング不要な推定器を導入する。
このフレームワークは、実際に重要な計算上の利点と統計上の利点を解放する。
数値実験により,我々の幾何認識パイプラインは離散化誤差のボトルネックを効果的に軽減することを示した。
- 参考スコア(独自算出の注目度): 32.357350666094156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Solving large scale Optimal Transport (OT) in machine learning typically relies on sampling measures to obtain a tractable discrete problem. While the discrete solver's accuracy is controllable, the rate of convergence of the discretization error is governed by the intrinsic dimension of our data. Therefore, the true bottleneck is the knowledge and control of the sampling error. In this work, we tackle this issue by introducing novel estimators for both sampling error and intrinsic dimension. The key finding is a simple, tuning-free estimator of $\text{OT}_c(ρ, \hatρ)$ that utilizes the semi-dual OT functional and, remarkably, requires no OT solver. Furthermore, we derive a fast intrinsic dimension estimator from the multi-scale decay of our sampling error estimator. This framework unlocks significant computational and statistical advantages in practice, enabling us to (i) quantify the convergence rate of the discretization error, (ii) calibrate the entropic regularization of Sinkhorn divergences to the data's intrinsic geometry, and (iii) introduce a novel, intrinsic-dimension-based Richardson extrapolation estimator that strongly debiases Wasserstein distance estimation. Numerical experiments demonstrate that our geometry-aware pipeline effectively mitigates the discretization error bottleneck while maintaining computational efficiency.
- Abstract(参考訳): 機械学習における大規模最適輸送(OT)の解決は、通常、抽出可能な離散的な問題を得るためのサンプリング手段に依存する。
離散解法の精度は制御可能であるが、離散化誤差の収束率は、データの本質的な次元によって制御される。
したがって、真のボトルネックはサンプリングエラーの知識と制御である。
本研究では,サンプリング誤差と本質的次元の両方に対する新しい推定器を導入することで,この問題に対処する。
鍵となる発見は、半双対OT関数を利用する$\text{OT}_c(ρ, \hatρ)$の単純でチューニング不要な推定器であり、驚くほどOTソルバを必要としない。
さらに,サンプリング誤差推定器のマルチスケール崩壊から,高速な固有次元推定器を導出した。
このフレームワークは、実際に重要な計算および統計上の利点を解放し、私たちを可能とします。
一 離散化誤差の収束率を定量化する。
(II)シンクホーン発散のエントロピー正則化をデータ固有の幾何学に校正し、
第三に、ワッサーシュタイン距離推定を強く阻害する、内在次元に基づくリチャードソン外挿推定器を導入する。
数値実験により,我々の幾何認識パイプラインは,計算効率を保ちながら,離散化誤差のボトルネックを効果的に軽減することを示した。
関連論文リスト
- Dimension-free error estimate for diffusion model and optimal scheduling [22.20348860913421]
拡散生成モデルは、経験的に観察された分布から合成データを生成するための強力なツールとして登場した。
従来の分析では、生成したデータと真のデータ分布の誤差を、ワッサーシュタイン距離やクルバック・リーバーの偏差の観点から定量化していた。
本研究では, 生成したデータ分布と真のデータ分布との相違点に有意な次元自由境界を導出する。
論文 参考訳(メタデータ) (2025-12-01T15:58:20Z) - Generative Modeling with Continuous Flows: Sample Complexity of Flow Matching [60.37045080890305]
本稿では,フローマッチングに基づく生成モデルにおいて,サンプルの複雑さを初めて解析する。
速度場推定誤差をニューラルネットワーク近似誤差、有限標本サイズによる統計的誤差、速度場推定のための有限個の最適化ステップによる最適化誤差に分解する。
論文 参考訳(メタデータ) (2025-12-01T05:14:25Z) - Revisiting Zeroth-Order Optimization: Minimum-Variance Two-Point Estimators and Directionally Aligned Perturbations [57.179679246370114]
乱摂動の分布は, 摂動段差がゼロになる傾向にあるため, 推定子の分散を最小限に抑える。
以上の結果から, 一定の長さを維持するのではなく, 真の勾配に方向を合わせることが可能であることが示唆された。
論文 参考訳(メタデータ) (2025-10-22T19:06:39Z) - Distributed Estimation and Inference for Semi-parametric Binary Response Models [8.309294338998539]
本稿では,分散コンピューティング環境下での半パラメトリック二値選択モデルの最大スコア推定について検討する。
直感的な分割・対数推定器は計算コストが高く、機械数に対する非正規制約によって制限される。
論文 参考訳(メタデータ) (2022-10-15T23:06:46Z) - Asymptotically Unbiased Instance-wise Regularized Partial AUC
Optimization: Theory and Algorithm [101.44676036551537]
One-way partial AUC (OPAUC) と Two-way partial AUC (TPAUC) はバイナリ分類器の平均性能を測定する。
既存の手法のほとんどはPAUCをほぼ最適化するしかなく、制御不能なバイアスにつながる。
本稿では,分散ロバスト最適化AUCによるPAUC問題の簡易化について述べる。
論文 参考訳(メタデータ) (2022-10-08T08:26:22Z) - Learning interaction kernels in stochastic systems of interacting
particles from multiple trajectories [13.3638879601361]
相互作用する粒子やエージェントのシステムと、相互作用カーネルによって決定されるダイナミクスを考察する。
正規化極大推定器に基づく逆問題に対する非パラメトリック推論手法を提案する。
相関条件により,この問題の条件数を制御し,推定器の整合性を証明することができることを示す。
論文 参考訳(メタデータ) (2020-07-30T01:28:06Z) - $\gamma$-ABC: Outlier-Robust Approximate Bayesian Computation Based on a
Robust Divergence Estimator [95.71091446753414]
最寄りの$gamma$-divergence推定器をデータ差分尺度として用いることを提案する。
本手法は既存の不一致対策よりも高いロバスト性を実現する。
論文 参考訳(メタデータ) (2020-06-13T06:09:27Z) - Neural Control Variates [71.42768823631918]
ニューラルネットワークの集合が、積分のよい近似を見つけるという課題に直面していることを示す。
理論的に最適な分散最小化損失関数を導出し、実際に安定したオンライントレーニングを行うための代替の複合損失を提案する。
具体的には、学習した光場近似が高次バウンスに十分な品質であることを示し、誤差補正を省略し、無視可能な可視バイアスのコストでノイズを劇的に低減できることを示した。
論文 参考訳(メタデータ) (2020-06-02T11:17:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。