論文の概要: Hilbert Curve Projection Distance for Distribution Comparison
- arxiv url: http://arxiv.org/abs/2205.15059v4
- Date: Tue, 6 Feb 2024 10:58:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 21:42:15.645234
- Title: Hilbert Curve Projection Distance for Distribution Comparison
- Title(参考訳): 分布比較のためのヒルベルト曲線投影距離
- Authors: Tao Li, Cheng Meng, Hongteng Xu, Jun Yu
- Abstract要約: 2つの確率分布間の距離を測定するため,Hilbert curve projection (HCP) 距離と呼ばれる新しい計量法を提案する。
HCP距離は適切な計量であり、有界な支持を持つ確率測度に対して十分に定義されていることを示す。
合成データと実世界データの両方の実験により、我々のHCP距離は、複雑さの低いワッサーシュタイン距離の効果的なサロゲートとして機能することが示された。
- 参考スコア(独自算出の注目度): 34.8765820950517
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distribution comparison plays a central role in many machine learning tasks
like data classification and generative modeling. In this study, we propose a
novel metric, called Hilbert curve projection (HCP) distance, to measure the
distance between two probability distributions with low complexity. In
particular, we first project two high-dimensional probability distributions
using Hilbert curve to obtain a coupling between them, and then calculate the
transport distance between these two distributions in the original space,
according to the coupling. We show that HCP distance is a proper metric and is
well-defined for probability measures with bounded supports. Furthermore, we
demonstrate that the modified empirical HCP distance with the $L_p$ cost in the
$d$-dimensional space converges to its population counterpart at a rate of no
more than $O(n^{-1/2\max\{d,p\}})$. To suppress the curse-of-dimensionality, we
also develop two variants of the HCP distance using (learnable) subspace
projections. Experiments on both synthetic and real-world data show that our
HCP distance works as an effective surrogate of the Wasserstein distance with
low complexity and overcomes the drawbacks of the sliced Wasserstein distance.
- Abstract(参考訳): 分散比較は、データ分類や生成モデリングといった多くの機械学習タスクにおいて中心的な役割を果たす。
本研究では,Hilbert curve projection (HCP) distanceと呼ばれる新しい計量法を提案し,低複雑性の2つの確率分布間の距離を測定する。
特に、まずヒルベルト曲線を用いた2つの高次元確率分布を投影し、それらのカップリングを求め、カップリングに従って元の空間におけるこれらの2つの分布間の移動距離を計算する。
我々は, hcp距離が適切な計量であり, 有界台を持つ確率測度に対して well-defined であることを示す。
さらに、$d$次元空間における$L_p$コストによる修正された経験的 HCP 距離が、$O(n^{-1/2\max\{d,p\}})$未満の速度でその集団に収束することを示した。
次元の呪いを抑制するため、(学習可能な)部分空間射影を用いたhcp距離の2つの変種も開発する。
合成データと実世界のデータの両方で実験したところ、我々のHCP距離はワッサーシュタイン距離の効果的なサロゲートとして機能し、スライスされたワッサーシュタイン距離の欠点を克服している。
関連論文リスト
- Relative-Translation Invariant Wasserstein Distance [82.6068808353647]
距離の新しい族、相対翻訳不変ワッサーシュタイン距離(RW_p$)を導入する。
我々は、$RW_p 距離もまた、分布変換に不変な商集合 $mathcalP_p(mathbbRn)/sim$ 上で定義される実距離測度であることを示す。
論文 参考訳(メタデータ) (2024-09-04T03:41:44Z) - Computing the Distance between unbalanced Distributions -- The flat
Metric [0.0]
平坦計量は、よく知られたワッサーシュタイン距離 W1 を、分布が不等質量である場合に一般化する。
この手法のコアはニューラルネットワークに基づいて、2つの測度間の距離を実現する最適なテスト関数を決定する。
論文 参考訳(メタデータ) (2023-08-02T09:30:22Z) - Energy-Based Sliced Wasserstein Distance [47.18652387199418]
スライスされたワッサーシュタイン(SW)距離の鍵成分はスライス分布である。
本研究では,スライシング分布をパラメータフリーなエネルギーベース分布として設計する。
次に、新しいスライスされたワッセルシュタイン計量、エネルギーベースのスライスされたワッセルシュタイン距離(EBSW)を導出する。
論文 参考訳(メタデータ) (2023-04-26T14:28:45Z) - Near-optimal estimation of smooth transport maps with kernel
sums-of-squares [81.02564078640275]
滑らかな条件下では、2つの分布の間の正方形ワッサーシュタイン距離は、魅力的な統計的誤差上界で効率的に計算できる。
生成的モデリングのような応用への関心の対象は、基礎となる最適輸送写像である。
そこで本研究では,地図上の統計的誤差であるL2$が,既存のミニマックス下限値とほぼ一致し,スムーズな地図推定が可能となる最初のトラクタブルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-03T13:45:36Z) - Depth-based pseudo-metrics between probability distributions [1.1470070927586016]
本研究では,データ深度に基づく連続確率測度と関連する中央領域の2つの疑似測度を提案する。
Wasserstein距離とは対照的に、提案された疑似メトリックは次元の呪いに苦しむことはない。
地域ベースの擬似メトリックは堅牢なw.r.tである。
両端と尾が重い。
論文 参考訳(メタデータ) (2021-03-23T17:33:18Z) - Two-sample Test using Projected Wasserstein Distance [18.46110328123008]
統計学と機械学習の基本的な問題である2サンプルテストのための予測されたワッサースタイン距離を開発する。
重要な貢献は、投影された確率分布の間のワッサーシュタイン距離を最大化する低次元線型写像を見つけるために最適射影を結合することである。
論文 参考訳(メタデータ) (2020-10-22T18:08:58Z) - The Unbalanced Gromov Wasserstein Distance: Conic Formulation and
Relaxation [0.0]
距離測度空間(すなわち確率分布を持つ距離空間)を比較することは、多くの機械学習問題の中心である。
そのような距離空間の間の最も一般的な距離は計量測度Gro-Wasserstein (GW) 距離であり、その距離は二次である。
GW の定式化は、任意の正測度を持つ距離空間の比較を等距離まで緩和する。
論文 参考訳(メタデータ) (2020-09-09T12:38:14Z) - Linear Optimal Transport Embedding: Provable Wasserstein classification
for certain rigid transformations and perturbations [79.23797234241471]
分布の区別は多くの科学分野において重要な問題である。
線形最適輸送(LOT)は分布の空間を$L2$-スペースに埋め込む。
複数の分布分類問題に対するLOTの利点を実証する。
論文 参考訳(メタデータ) (2020-08-20T19:09:33Z) - On Projection Robust Optimal Transport: Sample Complexity and Model
Misspecification [101.0377583883137]
射影ロバスト(PR)OTは、2つの測度の間のOTコストを最大化するために、射影可能な$k$次元部分空間を選択する。
私たちの最初の貢献は、PRワッサーシュタイン距離のいくつかの基本的な統計的性質を確立することである。
次に、部分空間を最適化するのではなく平均化することにより、PRW距離の代替として積分PRワッサーシュタイン距離(IPRW)を提案する。
論文 参考訳(メタデータ) (2020-06-22T14:35:33Z) - Fast and Robust Comparison of Probability Measures in Heterogeneous
Spaces [62.35667646858558]
本稿では, アンカー・エナジー (AE) とアンカー・ワッサースタイン (AW) 距離を紹介する。
我々の主な貢献は、素案実装が立方体となる対数四重項時間でAEを正確に計算するスイープラインアルゴリズムを提案することである。
AE と AW は,一般的な GW 近似の計算コストのごく一部において,様々な実験環境において良好に動作することを示す。
論文 参考訳(メタデータ) (2020-02-05T03:09:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。