論文の概要: Fast and Robust Comparison of Probability Measures in Heterogeneous
Spaces
- arxiv url: http://arxiv.org/abs/2002.01615v3
- Date: Wed, 10 Feb 2021 09:47:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 21:03:49.972086
- Title: Fast and Robust Comparison of Probability Measures in Heterogeneous
Spaces
- Title(参考訳): 不均一空間における確率測定の高速かつロバストな比較
- Authors: Ryoma Sato, Marco Cuturi, Makoto Yamada, Hisashi Kashima
- Abstract要約: 本稿では, アンカー・エナジー (AE) とアンカー・ワッサースタイン (AW) 距離を紹介する。
我々の主な貢献は、素案実装が立方体となる対数四重項時間でAEを正確に計算するスイープラインアルゴリズムを提案することである。
AE と AW は,一般的な GW 近似の計算コストのごく一部において,様々な実験環境において良好に動作することを示す。
- 参考スコア(独自算出の注目度): 62.35667646858558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Comparing two probability measures supported on heterogeneous spaces is an
increasingly important problem in machine learning. Such problems arise when
comparing for instance two populations of biological cells, each described with
its own set of features, or when looking at families of word embeddings trained
across different corpora/languages. For such settings, the Gromov Wasserstein
(GW) distance is often presented as the gold standard. GW is intuitive, as it
quantifies whether one measure can be isomorphically mapped to the other.
However, its exact computation is intractable, and most algorithms that claim
to approximate it remain expensive. Building on \cite{memoli-2011}, who
proposed to represent each point in each distribution as the 1D distribution of
its distances to all other points, we introduce in this paper the Anchor Energy
(AE) and Anchor Wasserstein (AW) distances, which are respectively the energy
and Wasserstein distances instantiated on such representations. Our main
contribution is to propose a sweep line algorithm to compute AE \emph{exactly}
in log-quadratic time, where a naive implementation would be cubic. This is
quasi-linear w.r.t. the description of the problem itself. Our second
contribution is the proposal of robust variants of AE and AW that uses rank
statistics rather than the original distances. We show that AE and AW perform
well in various experimental settings at a fraction of the computational cost
of popular GW approximations. Code is available at
\url{https://github.com/joisino/anchor-energy}.
- Abstract(参考訳): ヘテロジニアス空間でサポートされている2つの確率測度を比較することは、機械学習においてますます重要な問題である。
このような問題は、生物細胞の2つの集団を比較して、それぞれが独自の特徴を記述したり、異なるコーパス/言語で訓練された単語埋め込みの家族を見たりするときに生じる。
このような設定のために、Gromov Wasserstein (GW) 距離はしばしばゴールドスタンダードとして提示される。
GW は直観的であり、ある測度が他方に同型に写像できるかどうかを定量化する。
しかし、その正確な計算は難解であり、近似を主張するほとんどのアルゴリズムは高価である。
本稿では,各分布内の各点を,他のすべての点に対する距離の1次元分布として表現することを提唱した \cite{memoli-2011} に基づいて,アンカーエネルギー (ae) とアンカーワッサースタイン (aw) 距離を,それぞれそのような表現上でインスタンス化されたエネルギーとワッサースタイン距離として紹介する。
我々の主な貢献は、素な実装が立方体であるlog-quadratic timeにおいてae \emph{exactly}を計算するためのスイープラインアルゴリズムを提案することです。
これは準線形 w.r.t. 問題自体の記述である。
第2のコントリビューションは、元の距離ではなくランク統計を用いたAEとAWの頑健な変種の提案である。
AE と AW は,一般的な GW 近似の計算コストのごく一部において,様々な実験環境において良好に動作することを示す。
コードは \url{https://github.com/joisino/anchor-energy} で入手できる。
関連論文リスト
- Relative-Translation Invariant Wasserstein Distance [82.6068808353647]
距離の新しい族、相対翻訳不変ワッサーシュタイン距離(RW_p$)を導入する。
我々は、$RW_p 距離もまた、分布変換に不変な商集合 $mathcalP_p(mathbbRn)/sim$ 上で定義される実距離測度であることを示す。
論文 参考訳(メタデータ) (2024-09-04T03:41:44Z) - Properties of Discrete Sliced Wasserstein Losses [11.280151521887076]
Sliced Wasserstein (SW) 距離は、確率測度を比較するために、Wasserstein 距離の代替として人気がある。
広範囲のアプリケーションには画像処理、ドメイン適応、生成モデリングが含まれており、SWを最小化するためにパラメータを最適化することが一般的である。
このエネルギーの正則性と最適化特性、およびモンテカルロ近似 $mathcalE_p$ について検討する。
論文 参考訳(メタデータ) (2023-07-19T21:21:18Z) - Energy-Based Sliced Wasserstein Distance [47.18652387199418]
スライスされたワッサーシュタイン(SW)距離の鍵成分はスライス分布である。
本研究では,スライシング分布をパラメータフリーなエネルギーベース分布として設計する。
次に、新しいスライスされたワッセルシュタイン計量、エネルギーベースのスライスされたワッセルシュタイン距離(EBSW)を導出する。
論文 参考訳(メタデータ) (2023-04-26T14:28:45Z) - Linearized Wasserstein dimensionality reduction with approximation
guarantees [65.16758672591365]
LOT Wassmap は、ワーッサーシュタイン空間の低次元構造を明らかにするための計算可能なアルゴリズムである。
我々は,LOT Wassmapが正しい埋め込みを実現し,サンプルサイズの増加とともに品質が向上することを示す。
また、LOT Wassmapがペア距離計算に依存するアルゴリズムと比較して計算コストを大幅に削減することを示す。
論文 参考訳(メタデータ) (2023-02-14T22:12:16Z) - Markovian Sliced Wasserstein Distances: Beyond Independent Projections [51.80527230603978]
我々は、射影方向にマルコフ構造を課す新しいSW距離の族、Markovian sliced Wasserstein (MSW) 距離を導入する。
フロー,色移動,深部生成モデルなどの様々な応用において,従来のSW変種との距離を比較し,MSWの良好な性能を示す。
論文 参考訳(メタデータ) (2023-01-10T01:58:15Z) - Linear-Time Gromov Wasserstein Distances using Low Rank Couplings and
Costs [45.87981728307819]
異種空間に居住する関連するデータセットを比較して整列する能力は、機械学習においてますます重要な役割を担っている。
グロモフ・ワッサーシュタイン (Gromov-Wasserstein, GW) 形式主義はこの問題に対処するのに役立つ。
論文 参考訳(メタデータ) (2021-06-02T12:50:56Z) - Quantized Gromov-Wasserstein [10.592277756185046]
Quantized Gromov Wasserstein(qGW)は、部品を基本的なオブジェクトとして扱い、問題の理論上の上限の階層に収まるメトリクスです。
最適なgwマッチングを近似するアルゴリズムを開発し,アルゴリズムによる高速化とメモリ複雑性の低減を実現する。
我々は、最先端の状況を超えて、既存の文献よりも桁違いに大きいスケールでGWマッチングを適用することができる。
論文 参考訳(メタデータ) (2021-04-05T17:03:20Z) - The Unbalanced Gromov Wasserstein Distance: Conic Formulation and
Relaxation [0.0]
距離測度空間(すなわち確率分布を持つ距離空間)を比較することは、多くの機械学習問題の中心である。
そのような距離空間の間の最も一般的な距離は計量測度Gro-Wasserstein (GW) 距離であり、その距離は二次である。
GW の定式化は、任意の正測度を持つ距離空間の比較を等距離まで緩和する。
論文 参考訳(メタデータ) (2020-09-09T12:38:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。