論文の概要: On Out-of-sample Embedding in UMAP
- arxiv url: http://arxiv.org/abs/2606.04451v1
- Date: Wed, 03 Jun 2026 04:54:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.55455
- Title: On Out-of-sample Embedding in UMAP
- Title(参考訳): UMAPにおけるサンプル外埋め込みについて
- Authors: Mohammad Tariqul Islam, Jason W. Fleischer,
- Abstract要約: 隣接埋め込みアルゴリズムは、低次元空間における等価グラフ表現を構築することにより、高次元データの相関関係を明らかにする。
元のk-アネレス近傍グラフ内のペア相互作用を最適化することで、「反発効果」を克服する方法を示す。
また、パラメータ化されたUDPを用いてデータを埋め込むと、反発効果が自然に軽減されることを示す。
- 参考スコア(独自算出の注目度): 0.28647133890966986
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Neighbor embedding algorithms reveal correlations in high-dimensional data by constructing an equivalent graph representation in a lower-dimensional space. An increasingly popular algorithm is Uniform Manifold Learning and Projection (UMAP), which uses algebraic topology to map distances between the two spaces. While it works well on many types of data sets, UMAP has trouble adding out-of-sample points to a pre-existing mapping. In particular, UMAP often places new points on the periphery of the found clusters, rather than in their interiors with their correlated neighbors. Here, we overcome this ``repulsion effect'' by optimizing pairwise interactions within the original k-nearest-neighbor graph. Moreover, we show that parameterizing UMAP obtains better embeddings than non-parametric algorithms, particularly as the data gets more complex (e.g., medical images). We also show that the repulsion effect is naturally mitigated when a parameterized UMAP is employed to embed the data. We characterize different UMAP approaches using trustworthiness, nearest neighbor classifiers, and by analyzing attractive and repulsive forces in the embeddings.
- Abstract(参考訳): 隣接埋め込みアルゴリズムは、低次元空間における等価グラフ表現を構築することにより、高次元データの相関関係を明らかにする。
人気が高まっているアルゴリズムは、代数トポロジを用いて2つの空間間の距離をマッピングするUniform Manifold Learning and Projection (UMAP)である。
多くの種類のデータセットでうまく機能するが、UMAPは既存のマッピングにアウトオブサンプルポイントを追加するのに苦労している。
特に、UMAPは、その内部と隣人の関係よりも、発見されたクラスターの周辺に新しい点を配置することが多い。
ここでは、元のk-アネレス近傍グラフ内のペア相互作用を最適化することで、この「反発効果」を克服する。
さらに、パラメータ化UMAPは、特にデータが複雑になるにつれて、非パラメトリックアルゴリズムよりも優れた埋め込みが得られることを示す(医用画像など)。
また、パラメータ化されたUDPを用いてデータを埋め込むと、反発効果が自然に軽減されることを示す。
我々は, 信頼度, 隣り合う分類器, および埋め込みにおける魅力的な, 反発的な力を解析することによって, 異なるUMAPアプローチを特徴付ける。
関連論文リスト
- Understanding and Improving UMAP with Geometric and Topological Priors: The JORC-UMAP Algorithm [1.7484982792736636]
次元削減技術、特に UMAP は高次元データの可視化に広く用いられている。
我々は幾何学的先行としてOllivier-Ricci曲率を導入し、幾何学的ボトルネックにおけるエッジを強化し、冗長リンクを減らす。
合成および実世界のデータセットの実験により、JORC-UMAPは標準的なUMAPや他のDR法よりも破断と崩壊を効果的に削減することが示された。
論文 参考訳(メタデータ) (2026-01-23T08:42:56Z) - EmbedOR: Provable Cluster-Preserving Visualizations with Curvature-Based Stochastic Neighbor Embeddings [18.64124104660797]
UMAPやtSNEのような隣の埋め込み(SNE)アルゴリズムは、しばしばノイズや高次元データの幾何学を保存しない視覚化を生成する。
離散グラフ曲率を組み込んだSNEアルゴリズムである Embedor を提案する。
提案手法は,クラスタ構造に着目した曲率拡張距離計を用いて,アルゴリズムでデータを埋め込む。
論文 参考訳(メタデータ) (2025-09-03T20:38:39Z) - Adaptive $k$-nearest neighbor classifier based on the local estimation of the shape operator [49.87315310656657]
我々は, 局所曲率をサンプルで探索し, 周辺面積を適応的に定義する適応型$k$-nearest(kK$-NN)アルゴリズムを提案する。
多くの実世界のデータセットから、新しい$kK$-NNアルゴリズムは、確立された$k$-NN法と比較してバランスの取れた精度が優れていることが示されている。
論文 参考訳(メタデータ) (2024-09-08T13:08:45Z) - Efficient Graph Field Integrators Meet Point Clouds [59.27295475120132]
点雲を符号化するグラフ上での効率的な場積分のためのアルゴリズムを2種類提案する。
第1のクラスであるSeparatorFactorization(SF)は、ポイントメッシュグラフの有界属を利用するが、第2のクラスであるRFDiffusion(RFD)は、ポイントクラウドの一般的なepsilon-nearest-neighborグラフ表現を使用する。
論文 参考訳(メタデータ) (2023-02-02T08:33:36Z) - Far Away in the Deep Space: Dense Nearest-Neighbor-Based
Out-of-Distribution Detection [33.78080060234557]
Nearest-Neighborsアプローチは、オブジェクト中心のデータドメインでうまく機能することが示されている。
近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近
論文 参考訳(メタデータ) (2022-11-12T13:32:19Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Adversarial Examples for $k$-Nearest Neighbor Classifiers Based on
Higher-Order Voronoi Diagrams [69.4411417775822]
逆例は機械学習モデルにおいて広く研究されている現象である。
そこで本研究では,$k$-nearest 近傍分類の逆ロバスト性を評価するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-19T08:49:10Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z) - Parametric UMAP embeddings for representation and semi-supervised
learning [0.03823356975862005]
UMAPは、構造化データの低次元埋め込みを見つけるための非パラメトリックグラフに基づく次元減少アルゴリズムである。
パラメトリックUMAPは,学習されたパラメトリックマッピングの利点を考慮しつつ,非パラメトリックマップと同等に動作することを示す。
次に、UMAPを正規化として検討し、オートエンコーダの潜伏分布を制限し、パラメトリック的に変化したグローバル構造保存を行い、半教師付き学習における分類器の精度を向上させる。
論文 参考訳(メタデータ) (2020-09-27T23:45:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。