論文の概要: Understanding and Improving UMAP with Geometric and Topological Priors: The JORC-UMAP Algorithm
- arxiv url: http://arxiv.org/abs/2601.16552v1
- Date: Fri, 23 Jan 2026 08:42:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.609063
- Title: Understanding and Improving UMAP with Geometric and Topological Priors: The JORC-UMAP Algorithm
- Title(参考訳): 幾何学的・トポロジカル優先によるUMAPの理解と改善:JORC-UMAPアルゴリズム
- Authors: Xiaobin Li, Run Zhang,
- Abstract要約: 次元削減技術、特に UMAP は高次元データの可視化に広く用いられている。
我々は幾何学的先行としてOllivier-Ricci曲率を導入し、幾何学的ボトルネックにおけるエッジを強化し、冗長リンクを減らす。
合成および実世界のデータセットの実験により、JORC-UMAPは標準的なUMAPや他のDR法よりも破断と崩壊を効果的に削減することが示された。
- 参考スコア(独自算出の注目度): 1.7484982792736636
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nonlinear dimensionality reduction techniques, particularly UMAP, are widely used for visualizing high-dimensional data. However, UMAP's local Euclidean distance assumption often fails to capture intrinsic manifold geometry, leading to topological tearing and structural collapse. We identify UMAP's sensitivity to the k-nearest neighbor graph as a key cause. To address this, we introduce Ollivier-Ricci curvature as a geometric prior, reinforcing edges at geometric bottlenecks and reducing redundant links. Since curvature estimation is noise-sensitive, we also incorporate a topological prior using Jaccard similarity to ensure neighborhood consistency. The resulting method, JORC-UMAP, better distinguishes true manifold structure from spurious connections. Experiments on synthetic and real-world datasets show that JORC-UMAP reduces tearing and collapse more effectively than standard UMAP and other DR methods, as measured by SVM accuracy and triplet preservation scores, while maintaining computational efficiency. This work offers a geometry-aware enhancement to UMAP for more faithful data visualization.
- Abstract(参考訳): 非線形次元減少技術、特に UMAP は高次元データの可視化に広く用いられている。
しかし、UMAPの局所ユークリッド距離の仮定は、しばしば固有多様体の幾何学を捉えることに失敗し、トポロジカルな裂け目と構造的崩壊をもたらす。
我々は、k-アネレスト近傍グラフに対するUMAPの感度を重要な原因とみなす。
この問題に対処するために,Ollivier-Ricci曲率を幾何学的先行として導入し,幾何的ボトルネックにおけるエッジの強化と冗長リンクの低減を行う。
曲率推定は雑音に敏感であるため,Jaccardの類似性を利用して近傍の整合性を確保するトポロジカルな事前計算も行う。
結果の方法であるJORC-UMAPは、真の多様体構造をスプリアス接続とよりよく区別する。
合成および実世界のデータセットを用いた実験により、JORC-UMAPは、計算効率を維持しながら、SVMの精度と3重項保存スコアによって測定されるように、標準的なUMAPや他のDR手法よりも、断裂と崩壊を効果的に削減することが示された。
この研究は、より忠実なデータ視覚化のために、 UMAP の幾何対応の強化を提供する。
関連論文リスト
- Variational Geometric Information Bottleneck: Learning the Shape of Understanding [0.0]
variational Geometric Information Bottleneck (V-GIB) は、相互情報圧縮と曲率正規化を統合する変分推定器である。
V-GIBは、幾何学的に一貫性があり、データ効率が高く、人間の理解可能な構造と整合した表現への原則的かつ測定可能な経路を提供する。
論文 参考訳(メタデータ) (2025-11-04T11:33:54Z) - EmbedOR: Provable Cluster-Preserving Visualizations with Curvature-Based Stochastic Neighbor Embeddings [18.64124104660797]
UMAPやtSNEのような隣の埋め込み(SNE)アルゴリズムは、しばしばノイズや高次元データの幾何学を保存しない視覚化を生成する。
離散グラフ曲率を組み込んだSNEアルゴリズムである Embedor を提案する。
提案手法は,クラスタ構造に着目した曲率拡張距離計を用いて,アルゴリズムでデータを埋め込む。
論文 参考訳(メタデータ) (2025-09-03T20:38:39Z) - Disentangled Representation Learning with the Gromov-Monge Gap [65.73194652234848]
乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文 参考訳(メタデータ) (2024-07-10T16:51:32Z) - Last-Iterate Convergence of Adaptive Riemannian Gradient Descent for Equilibrium Computation [52.73824786627612]
本稿では,テクスト幾何学的強単調ゲームに対する新たな収束結果を確立する。
我々のキーとなる結果は、RGDがテクスト幾何学的手法で最終定位線形収束を実現することを示しています。
全体として、ユークリッド設定を超えるゲームに対して、幾何学的に非依存な最終点収束解析を初めて提示する。
論文 参考訳(メタデータ) (2023-06-29T01:20:44Z) - Exploring Data Geometry for Continual Learning [64.4358878435983]
非定常データストリームのデータ幾何を探索することにより,新しい視点から連続学習を研究する。
提案手法は,新しいデータによって引き起こされる幾何構造に対応するために,基底空間の幾何学を動的に拡張する。
実験により,本手法はユークリッド空間で設計したベースライン法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2023-04-08T06:35:25Z) - Learning Topology-Preserving Data Representations [9.710409273484464]
位相保存データ表現(次元減少)を学習する手法を提案する。
この手法の中核は、元の高次元データと潜時空間における低次元表現との間の表現トポロジディバージェンス(RTD)の最小化である。
提案手法は, 線形相関, 三重項距離ランキング精度, 永続バーコード間のワッサーシュタイン距離によって測定された, 最先端の競合相手よりも, データ多様体のグローバル構造とトポロジーをよりよく保存する。
論文 参考訳(メタデータ) (2023-01-31T22:55:04Z) - Clustering with UMAP: Why and How Connectivity Matters [3.04585143845864]
t-SNE や UMAP のようなトポロジーに基づく次元削減手法は、高次元データにおいて成功と人気が高まっている。
ノード接続性 (k-Nearest Neighbors vs textitmutual k-Nearest Neighbors) と近辺性 (Path Neighbors を介して隣接) が次元減少に及ぼす影響について検討した。
論文 参考訳(メタデータ) (2021-08-12T04:25:03Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Learning Flat Latent Manifolds with VAEs [16.725880610265378]
本稿では、ユークリッド計量がデータポイント間の類似性のプロキシとなる変分自動エンコーダのフレームワークの拡張を提案する。
我々は、変分オートエンコーダで一般的に使用されるコンパクトな以前のものを、最近発表されたより表現力のある階層型に置き換える。
提案手法は,ビデオ追跡ベンチマークを含む,さまざまなデータセットを用いて評価する。
論文 参考訳(メタデータ) (2020-02-12T09:54:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。