論文の概要: Tree-Wasserstein Distance for High Dimensional Data with a Latent Feature Hierarchy
- arxiv url: http://arxiv.org/abs/2410.21107v2
- Date: Sun, 01 Dec 2024 02:36:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-03 16:56:29.101385
- Title: Tree-Wasserstein Distance for High Dimensional Data with a Latent Feature Hierarchy
- Title(参考訳): 潜在的特徴階層を持つ高次元データに対するツリー・ワッサースタイン距離
- Authors: Ya-Wei Eileen Lin, Ronald R. Coifman, Gal Mishne, Ronen Talmon,
- Abstract要約: 2つの重要な側面を持つ高次元データに対する新しいツリー・ワッサースタイン距離(TWD)を提案する。
まず、我々のTWDは、潜在的な特徴階層を持つデータのために特別に設計されています。
データ観測に基づいて計算したTWDが、潜在特徴階層で定義されたTWDを確実に回復することを示す。
- 参考スコア(独自算出の注目度): 12.2853783834605
- License:
- Abstract: Finding meaningful distances between high-dimensional data samples is an important scientific task. To this end, we propose a new tree-Wasserstein distance (TWD) for high-dimensional data with two key aspects. First, our TWD is specifically designed for data with a latent feature hierarchy, i.e., the features lie in a hierarchical space, in contrast to the usual focus on embedding samples in hyperbolic space. Second, while the conventional use of TWD is to speed up the computation of the Wasserstein distance, we use its inherent tree as a means to learn the latent feature hierarchy. The key idea of our method is to embed the features into a multi-scale hyperbolic space using diffusion geometry and then present a new tree decoding method by establishing analogies between the hyperbolic embedding and trees. We show that our TWD computed based on data observations provably recovers the TWD defined with the latent feature hierarchy and that its computation is efficient and scalable. We showcase the usefulness of the proposed TWD in applications to word-document and single-cell RNA-sequencing datasets, demonstrating its advantages over existing TWDs and methods based on pre-trained models.
- Abstract(参考訳): 高次元データサンプル間の有意義な距離を見つけることは重要な科学的課題である。
この目的のために,2つの重要な側面を持つ高次元データに対する新しいツリー・ワッサースタイン距離(TWD)を提案する。
第一に、我々のTWDは、ハイパーボリック空間にサンプルを埋め込むのに対して、階層的な空間にあるような、潜在的な特徴階層を持つデータのために特別に設計されている。
第二に、従来のTWDの使用はワッサーシュタイン距離の計算を高速化することであるが、その固有木を潜在特徴階層の学習手段として利用する。
本手法の鍵となる考え方は,拡散幾何学を用いた多次元双曲空間に特徴を埋め込んで,双曲埋め込みと木の類似性を確立することで,新しい木復号法を提案することである。
データ観測に基づいて計算したTWDは、潜在特徴階層で定義されたTWDを確実に復元し、その計算が効率的でスケーラブルであることを示す。
本稿では,単語文書および単一セルRNAシークエンシングデータセットへの応用における提案TWDの有用性を示すとともに,既存のTWDと事前学習モデルに基づく手法に対する利点を示す。
関連論文リスト
- Fast unsupervised ground metric learning with tree-Wasserstein distance [14.235762519615175]
教師なしの地上距離学習アプローチが導入されました
木にサンプルや特徴を埋め込むことでWSV法を強化し,木-ワッサーシュタイン距離(TWD)を計算することを提案する。
我々は、このアルゴリズムが最もよく知られた方法よりも完全なWSVアプローチの近似に収束し、$mathcalO(n3)$複雑さを持つことを理論的かつ経験的に実証する。
論文 参考訳(メタデータ) (2024-11-11T23:21:01Z) - Improving Hyperbolic Representations via Gromov-Wasserstein Regularization [19.933488017214]
双曲型ニューラルネットワークにおける新しい正規化機構として,Gromov-Wasserstein (GW) 距離を適用した。
具体的には、双曲型ニューラルネットワークの層を輸送マップとして扱い、GW距離を計算する。
我々は、トレーニングセットに基づいて計算されたGW距離が、基礎となるデータ分布のGW距離をよく近似していることを検証する。
論文 参考訳(メタデータ) (2024-07-15T07:37:31Z) - $\text{H}^2\text{TNE}$: Temporal Heterogeneous Information Network Embedding in Hyperbolic Spaces [16.31067633778912]
時間的HINに対する双曲的ヘテロジニアス時間ネットワーク埋め込みモデルを提案する。
具体的には、時間的かつ不均一に2重拘束されたランダムウォーク戦略を利用して、構造的および意味的な情報をキャプチャする。
実験の結果,本手法はSOTAモデルと比較して時間的リンク予測とノード分類に優れていた。
論文 参考訳(メタデータ) (2023-04-14T07:39:52Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - Averaging Spatio-temporal Signals using Optimal Transport and Soft
Alignments [110.79706180350507]
Fr'teche は双対性を意味し, 時間的バレシェセンタを定義するために提案した損失が有効であることを示す。
手書き文字と脳画像データによる実験は、我々の理論的発見を裏付けるものである。
論文 参考訳(メタデータ) (2022-03-11T09:46:22Z) - Wasserstein Distances, Geodesics and Barycenters of Merge Trees [9.149293243237778]
本稿では, マージ木の距離, 測地線, バリセンタを推定するための統一的な計算枠組みを提案する。
我々は, 地磁気学とバリセンターの効率的な計算を可能にするために, マージツリー間のワッサーシュタイン距離という新しい測定基準を導入する。
論文 参考訳(メタデータ) (2021-07-16T09:27:49Z) - Manifold Topology Divergence: a Framework for Comparing Data Manifolds [109.0784952256104]
本研究では,深部生成モデルの評価を目的としたデータ多様体の比較フレームワークを開発する。
クロスバーコードに基づき,manifold Topology Divergence score(MTop-Divergence)を導入する。
MTop-Divergenceは,様々なモードドロップ,モード内崩壊,モード発明,画像乱れを正確に検出する。
論文 参考訳(メタデータ) (2021-06-08T00:30:43Z) - Depth-based pseudo-metrics between probability distributions [1.1470070927586016]
本研究では,データ深度に基づく連続確率測度と関連する中央領域の2つの疑似測度を提案する。
Wasserstein距離とは対照的に、提案された疑似メトリックは次元の呪いに苦しむことはない。
地域ベースの擬似メトリックは堅牢なw.r.tである。
両端と尾が重い。
論文 参考訳(メタデータ) (2021-03-23T17:33:18Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - On Projection Robust Optimal Transport: Sample Complexity and Model
Misspecification [101.0377583883137]
射影ロバスト(PR)OTは、2つの測度の間のOTコストを最大化するために、射影可能な$k$次元部分空間を選択する。
私たちの最初の貢献は、PRワッサーシュタイン距離のいくつかの基本的な統計的性質を確立することである。
次に、部分空間を最適化するのではなく平均化することにより、PRW距離の代替として積分PRワッサーシュタイン距離(IPRW)を提案する。
論文 参考訳(メタデータ) (2020-06-22T14:35:33Z) - Augmented Sliced Wasserstein Distances [55.028065567756066]
拡張スライスされたワッサーシュタイン距離(ASWD)と呼ばれる新しい距離測定法を提案する。
ASWDは、ニューラルネットワークによってパラメータ化された高次元超曲面への最初のマッピングサンプルによって構成される。
数値的な結果から、ASWDは、合成問題と実世界の問題の両方において、他のワッサーシュタイン変種を著しく上回っていることが示されている。
論文 参考訳(メタデータ) (2020-06-15T23:00:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。