論文の概要: When One Point Is Not Enough: Addressing Ambiguous Instances in Dimensionality Reduction by Splitting
- arxiv url: http://arxiv.org/abs/2605.23540v1
- Date: Fri, 22 May 2026 12:01:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.334185
- Title: When One Point Is Not Enough: Addressing Ambiguous Instances in Dimensionality Reduction by Splitting
- Title(参考訳): 1つの点が十分でない場合:分割による次元減少における曖昧な事例に対処する
- Authors: Diede P. M. van der Hoorn, Alessio Arleo, Fernando V. Paulovich,
- Abstract要約: 高次元データの可視化にはDR法が広く用いられている。
DRに基づく分析における重要な課題は、射影の微細な局所構造の分析に依存する近傍の発見である。
本稿では、一般的に見過ごされた視覚的アーティファクトのソースであるあいまいなインスタンスを強調します。
グラフベースのアプローチでは、曖昧なインスタンスを識別し、プロジェクション内の複数のポイントとして複製し、それぞれのコピーをそれぞれの近傍に配置する。
- 参考スコア(独自算出の注目度): 46.5272770104348
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dimensionality Reduction (DR) methods are widely used to visualize high-dimensional data. One key task in DR-based analysis is discovering neighborhoods, which relies on analyzing the fine-grained local structure of a projection. However, DR is an inherently lossy process; no technique can perfectly preserve the high-dimensional relationships, and projections therefore contain visual artifacts. In this paper, we highlight a typically overlooked source of visual artifacts: ambiguous instances. These are instances that are highly similar to multiple mutually dissimilar neighborhoods in the high-dimensional space. Standard DR methods cannot faithfully project such instances, since each data instance is mapped to a single point in the visual space. As a result, such an instance is placed in only one of its neighborhoods (or in none at all), so only part of its neighborhood structure is represented. We call this distortion partial neighborhood embedding. In this paper, we introduce a graph-based approach that identifies ambiguous instances and replicates them as multiple points in the projection, placing each copy within its respective neighborhood. We use UMAP for our results, but our approach also generalizes to other local graph-based DR techniques, and we show that our approach reveals previously hidden neighborhood memberships in projections and reduces partial neighborhood embedding across multiple examples, and is further supported by quantitative analyses.
- Abstract(参考訳): 高次元データの可視化にはDR法が広く用いられている。
DRに基づく分析における重要な課題は、射影の微細な局所構造の分析に依存する近傍の発見である。
しかし、DRは本質的に損失のあるプロセスであり、高次元の関係を完全に保存する技術はなく、したがって投影には視覚的アーティファクトが含まれている。
本稿では、一般的に見過ごされた視覚的アーティファクトのソースであるあいまいなインスタンスを強調します。
これらは高次元空間における複数の互いに異なる近傍に非常によく似た例である。
標準的なDRメソッドは、各データインスタンスが視覚空間の単一ポイントにマップされるため、そのようなインスタンスを忠実に投影することはできない。
結果として、そのようなインスタンスは、その近傍の1つ(または全くない)にのみ配置されるため、その近傍構造の一部のみが表現される。
これを歪み部分埋め込みと呼ぶ。
本稿では,不明瞭なインスタンスを識別し,各コピーを各近傍に配置し,プロジェクション内の複数のポイントとして再現するグラフベースの手法を提案する。
提案手法は,提案手法を他の局所グラフベースのDR手法にも適用し,提案手法は従来隠れていた近傍メンバシップを投影中に明らかにし,複数の例にまたがる部分的な近傍の埋め込みを低減し,定量的解析によってさらに支持されていることを示す。
関連論文リスト
- Robust Scene Coordinate Regression via Geometrically-Consistent Global Descriptors [52.57327385675752]
幾何学的構造と視覚的類似性の両方に整合したグローバルな記述子を学習するアグリゲータモジュールを提案する。
これにより、信頼できないオーバーラップスコアによる誤関連が修正される。
挑戦的なベンチマークの実験では、大規模環境ではかなりのローカライゼーションが得られた。
論文 参考訳(メタデータ) (2025-12-19T04:24:03Z) - Dimension Reduction with Locally Adjusted Graphs [27.563902312709075]
LocalMAPは、この課題に対処するためにグラフを動的かつ局所的に調整する次元削減アルゴリズムである。
生物データセットのケーススタディを通じて、ローカルマップの利点を実証する。
論文 参考訳(メタデータ) (2024-12-19T22:21:39Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Far Away in the Deep Space: Dense Nearest-Neighbor-Based
Out-of-Distribution Detection [33.78080060234557]
Nearest-Neighborsアプローチは、オブジェクト中心のデータドメインでうまく機能することが示されている。
近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近
論文 参考訳(メタデータ) (2022-11-12T13:32:19Z) - Multi-point dimensionality reduction to improve projection layout
reliability [77.34726150561087]
通常の次元還元(dr)では、m-次元空間(原空間)の各データインスタンスは、d-次元空間(視覚空間)内の一点にマッピングされる。
当社のソリューションであるRed Gray Plusは、通常のDRとグラフ描画技術を組み合わせて構築され、拡張されています。
論文 参考訳(メタデータ) (2021-01-15T17:17:02Z) - TopoMap: A 0-dimensional Homology Preserving Projection of
High-Dimensional Data [14.815201366187743]
本稿では,地図作成過程におけるトポロジカルな保証を提供する新しいプロジェクション手法であるトポマップを紹介する。
提案手法は,高次元データのリプス濾過の0次元永続図を保存しながら,高次元空間から視覚空間へのマッピングを行う。
論文 参考訳(メタデータ) (2020-09-03T08:30:02Z) - A Grid-based Method for Removing Overlaps of Dimensionality Reduction
Scatterplot Layouts [40.11095094521714]
Distance Grid (DGrid) は、DDR(Diality Reduction) scatterplotレイアウトのオーバーラップを取り除くための新しい後処理戦略である。
元のレイアウトの特徴を忠実に保存し、最小のグリフサイズを束縛する。
論文 参考訳(メタデータ) (2019-03-08T18:20:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。