Fugu-MT 論文翻訳(概要): Preserving local densities in low-dimensional embeddings

論文の概要: Preserving local densities in low-dimensional embeddings

arxiv url: http://arxiv.org/abs/2301.13732v1
Date: Tue, 31 Jan 2023 16:11:54 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-01 16:03:21.657434
Title: Preserving local densities in low-dimensional embeddings
Title（参考訳）: 低次元埋め込みにおける局所密度の保存
Authors: Jonas Fischer, Rebekka Burkholz, Jilles Vreeken
Abstract要約: tSNEやUMAPのような最先端の手法は、高次元データに隠された局所構造を明らかにするのに優れている。しかし, これらの手法は, 密度の相対的差など, 局所的な特性の再構築に失敗することを示す。局所密度をほぼ保存するdtSNEを提案する。
参考スコア（独自算出の注目度）: 37.278617643507815
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Low-dimensional embeddings and visualizations are an indispensable tool for analysis of high-dimensional data. State-of-the-art methods, such as tSNE and UMAP, excel in unveiling local structures hidden in high-dimensional data and are therefore routinely applied in standard analysis pipelines in biology. We show, however, that these methods fail to reconstruct local properties, such as relative differences in densities (Fig. 1) and that apparent differences in cluster size can arise from computational artifact caused by differing sample sizes (Fig. 2). Providing a theoretical analysis of this issue, we then suggest dtSNE, which approximately conserves local densities. In an extensive study on synthetic benchmark and real world data comparing against five state-of-the-art methods, we empirically show that dtSNE provides similar global reconstruction, but yields much more accurate depictions of local distances and relative densities.
Abstract（参考訳）: 低次元埋め込みと可視化は、高次元データの分析に欠かせないツールである。 tSNEやUMAPのような最先端の手法は、高次元データに隠された局所構造を明らかにするのに優れており、生物学の標準的な分析パイプラインに日常的に適用されている。しかし,これらの手法は密度の相対的差(図1)のような局所的な性質を再構築することができないこと,また,サンプルサイズの違いによる計算的アーティファクトからクラスタサイズに明らかな差が生じること(図2)を示した。この問題を理論的に解析し、局所密度をほぼ保存するdtSNEを提案する。 5つの最先端手法と比較した総合ベンチマークと実世界データに関する広範な研究において、dtsneは同様のグローバル再構築を提供するが、局所距離と相対密度をより正確に表現できることを示した。

関連論文リスト

Isolation-based Spherical Ensemble Representations for Anomaly Detection [60.989157958972356]
不正検出、ネットワークセキュリティ、ログ監視を対象とするアプリケーションによるデータマイニングと管理において、異常検出は重要なタスクである。既存の教師なし異常検出手法は、分散仮定の矛盾、計算の非効率性、異なる異常型を扱う難しさなど、基本的な課題に直面している。 Isolation-based Spherical Ensemble Representations (ISER) は, 局所密度特性のプロキシとしてハイパースフィアラジイを用いて, 線形時間と定数空間の複雑さを保ちながら, 既存の分離法を拡張したものである。
論文参考訳（メタデータ） (2025-10-15T09:00:05Z)
UMATO: Bridging Local and Global Structures for Reliable Visual Analytics with Dimensionality Reduction [15.647677478039668]
次元還元(DR)技術は、元のデータの構造的特性を全て保存することはできない。 DR技術は、局所的近傍構造(局所的手法)または点間の対距離(グローバル手法)のような大域的構造(局所的手法)の保存に重点を置いている。
論文参考訳（メタデータ） (2025-08-22T08:55:50Z)
IsUMap: Manifold Learning and Data Visualization leveraging Vietoris-Rips filtrations [0.08796261172196743]
局所的に歪んだ距離空間に対する距離表現の体系的かつ詳細な構成を示す。提案手法は,非一様データ分布と複雑な局所的ジオメトリの調整により,既存の手法の制約に対処する。
論文参考訳（メタデータ） (2024-07-25T07:46:30Z)
Sailing in high-dimensional spaces: Low-dimensional embeddings through angle preservation [12.775562063735006]
高次元データの低次元埋め込み(LDE)は、科学や工学においてユビキタスである。我々は,LDE学習の新たな視点として,データポイント間の角度を再構築することを提案する。
論文参考訳（メタデータ） (2024-06-14T09:44:06Z)
Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文参考訳（メタデータ） (2024-02-03T19:00:19Z)
Dimensionality-Aware Outlier Detection: Theoretical and Experimental Analysis [9.962838991341874]
本稿では,データセット内の次元の局所的変動をフルに考慮した非パラメトリックな外乱検出手法を提案する。提案手法は,3つの重要なベンチマーク・アウトレイラ検出手法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-01-10T01:07:35Z)
A Heat Diffusion Perspective on Geodesic Preserving Dimensionality Reduction [66.21060114843202]
熱測地線埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法を提案する。その結果,本手法は,地中真理多様体距離の保存において,既存の技術よりも優れていることがわかった。また,連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用した。
論文参考訳（メタデータ） (2023-05-30T13:58:50Z)
Laplacian-based Cluster-Contractive t-SNE for High Dimensional Data Visualization [20.43471678277403]
本稿では t-SNE に基づく新しいグラフベース次元削減手法 LaptSNE を提案する。具体的には、LaptSNEはグラフラプラシアンの固有値情報を利用して、低次元埋め込みにおけるポテンシャルクラスタを縮小する。ラプラシアン合成目的による最適化を考える際には、より広い関心を持つであろう勾配を解析的に計算する方法を示す。
論文参考訳（メタデータ） (2022-07-25T14:10:24Z)
Incorporating Texture Information into Dimensionality Reduction for High-Dimensional Images [65.74185962364211]
距離ベース次元削減手法に周辺情報を組み込む手法を提案する。画像パッチを比較する異なる手法の分類に基づいて,様々なアプローチを探索する。
論文参考訳（メタデータ） (2022-02-18T13:17:43Z)
A Local Similarity-Preserving Framework for Nonlinear Dimensionality Reduction with Neural Networks [56.068488417457935]
本稿では,Vec2vecという新しい局所非線形手法を提案する。ニューラルネットワークを訓練するために、マトリックスの近傍類似度グラフを構築し、データポイントのコンテキストを定義します。 8つの実データセットにおけるデータ分類とクラスタリングの実験により、Vec2vecは統計仮説テストにおける古典的な次元削減法よりも優れていることが示された。
論文参考訳（メタデータ） (2021-03-10T23:10:47Z)
Joint Characterization of Multiscale Information in High Dimensional Data [0.0]
グローバルアプローチとローカルアプローチの相乗効果を生かした多スケール共同評価手法を提案します。関節の特徴は, PCA や t-sne のいずれからも明らかでない信号の検出と分離が可能であることを示す。
論文参考訳（メタデータ） (2021-02-18T23:33:00Z)
LDLE: Low Distortion Local Eigenmaps [77.02534963571597]
本稿では、低次元のデータセットの低歪み局所ビューのセットを構築し、それらを登録してグローバル埋め込みを取得するマニホールド学習技術である低歪み局所固有マップ(LDLE)を紹介します。局所ビューはグラフラプラシアンのグローバル固有ベクトルを用いて構築され、procrustes分析を用いて登録される。
論文参考訳（メタデータ） (2021-01-26T19:55:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。