論文の概要: Preserving local densities in low-dimensional embeddings
- arxiv url: http://arxiv.org/abs/2301.13732v1
- Date: Tue, 31 Jan 2023 16:11:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 16:03:21.657434
- Title: Preserving local densities in low-dimensional embeddings
- Title(参考訳): 低次元埋め込みにおける局所密度の保存
- Authors: Jonas Fischer, Rebekka Burkholz, Jilles Vreeken
- Abstract要約: tSNEやUMAPのような最先端の手法は、高次元データに隠された局所構造を明らかにするのに優れている。
しかし, これらの手法は, 密度の相対的差など, 局所的な特性の再構築に失敗することを示す。
局所密度をほぼ保存するdtSNEを提案する。
- 参考スコア(独自算出の注目度): 37.278617643507815
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Low-dimensional embeddings and visualizations are an indispensable tool for
analysis of high-dimensional data. State-of-the-art methods, such as tSNE and
UMAP, excel in unveiling local structures hidden in high-dimensional data and
are therefore routinely applied in standard analysis pipelines in biology. We
show, however, that these methods fail to reconstruct local properties, such as
relative differences in densities (Fig. 1) and that apparent differences in
cluster size can arise from computational artifact caused by differing sample
sizes (Fig. 2). Providing a theoretical analysis of this issue, we then suggest
dtSNE, which approximately conserves local densities. In an extensive study on
synthetic benchmark and real world data comparing against five state-of-the-art
methods, we empirically show that dtSNE provides similar global reconstruction,
but yields much more accurate depictions of local distances and relative
densities.
- Abstract(参考訳): 低次元埋め込みと可視化は、高次元データの分析に欠かせないツールである。
tSNEやUMAPのような最先端の手法は、高次元データに隠された局所構造を明らかにするのに優れており、生物学の標準的な分析パイプラインに日常的に適用されている。
しかし,これらの手法は密度の相対的差(図1)のような局所的な性質を再構築することができないこと,また,サンプルサイズの違いによる計算的アーティファクトからクラスタサイズに明らかな差が生じること(図2)を示した。
この問題を理論的に解析し、局所密度をほぼ保存するdtSNEを提案する。
5つの最先端手法と比較した総合ベンチマークと実世界データに関する広範な研究において、dtsneは同様のグローバル再構築を提供するが、局所距離と相対密度をより正確に表現できることを示した。
関連論文リスト
- IsUMap: Manifold Learning and Data Visualization leveraging Vietoris-Rips filtrations [0.08796261172196743]
局所的に歪んだ距離空間に対する距離表現の体系的かつ詳細な構成を示す。
提案手法は,非一様データ分布と複雑な局所的ジオメトリの調整により,既存の手法の制約に対処する。
論文 参考訳(メタデータ) (2024-07-25T07:46:30Z) - Sailing in high-dimensional spaces: Low-dimensional embeddings through angle preservation [12.775562063735006]
高次元データの低次元埋め込み(LDE)は、科学や工学においてユビキタスである。
我々は,LDE学習の新たな視点として,データポイント間の角度を再構築することを提案する。
論文 参考訳(メタデータ) (2024-06-14T09:44:06Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Dimensionality-Aware Outlier Detection: Theoretical and Experimental Analysis [9.962838991341874]
本稿では,データセット内の次元の局所的変動をフルに考慮した非パラメトリックな外乱検出手法を提案する。
提案手法は,3つの重要なベンチマーク・アウトレイラ検出手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-01-10T01:07:35Z) - A Heat Diffusion Perspective on Geodesic Preserving Dimensionality
Reduction [66.21060114843202]
熱測地線埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法を提案する。
その結果,本手法は,地中真理多様体距離の保存において,既存の技術よりも優れていることがわかった。
また,連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-05-30T13:58:50Z) - Laplacian-based Cluster-Contractive t-SNE for High Dimensional Data
Visualization [20.43471678277403]
本稿では t-SNE に基づく新しいグラフベース次元削減手法 LaptSNE を提案する。
具体的には、LaptSNEはグラフラプラシアンの固有値情報を利用して、低次元埋め込みにおけるポテンシャルクラスタを縮小する。
ラプラシアン合成目的による最適化を考える際には、より広い関心を持つであろう勾配を解析的に計算する方法を示す。
論文 参考訳(メタデータ) (2022-07-25T14:10:24Z) - Incorporating Texture Information into Dimensionality Reduction for
High-Dimensional Images [65.74185962364211]
距離ベース次元削減手法に周辺情報を組み込む手法を提案する。
画像パッチを比較する異なる手法の分類に基づいて,様々なアプローチを探索する。
論文 参考訳(メタデータ) (2022-02-18T13:17:43Z) - A Local Similarity-Preserving Framework for Nonlinear Dimensionality
Reduction with Neural Networks [56.068488417457935]
本稿では,Vec2vecという新しい局所非線形手法を提案する。
ニューラルネットワークを訓練するために、マトリックスの近傍類似度グラフを構築し、データポイントのコンテキストを定義します。
8つの実データセットにおけるデータ分類とクラスタリングの実験により、Vec2vecは統計仮説テストにおける古典的な次元削減法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-03-10T23:10:47Z) - Joint Characterization of Multiscale Information in High Dimensional
Data [0.0]
グローバルアプローチとローカルアプローチの相乗効果を生かした多スケール共同評価手法を提案します。
関節の特徴は, PCA や t-sne のいずれからも明らかでない信号の検出と分離が可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T23:33:00Z) - LDLE: Low Distortion Local Eigenmaps [77.02534963571597]
本稿では、低次元のデータセットの低歪み局所ビューのセットを構築し、それらを登録してグローバル埋め込みを取得するマニホールド学習技術である低歪み局所固有マップ(LDLE)を紹介します。
局所ビューはグラフラプラシアンのグローバル固有ベクトルを用いて構築され、procrustes分析を用いて登録される。
論文 参考訳(メタデータ) (2021-01-26T19:55:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。