論文の概要: Preserving local densities in low-dimensional embeddings
- arxiv url: http://arxiv.org/abs/2301.13732v1
- Date: Tue, 31 Jan 2023 16:11:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 16:03:21.657434
- Title: Preserving local densities in low-dimensional embeddings
- Title(参考訳): 低次元埋め込みにおける局所密度の保存
- Authors: Jonas Fischer, Rebekka Burkholz, Jilles Vreeken
- Abstract要約: tSNEやUMAPのような最先端の手法は、高次元データに隠された局所構造を明らかにするのに優れている。
しかし, これらの手法は, 密度の相対的差など, 局所的な特性の再構築に失敗することを示す。
局所密度をほぼ保存するdtSNEを提案する。
- 参考スコア(独自算出の注目度): 37.278617643507815
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Low-dimensional embeddings and visualizations are an indispensable tool for
analysis of high-dimensional data. State-of-the-art methods, such as tSNE and
UMAP, excel in unveiling local structures hidden in high-dimensional data and
are therefore routinely applied in standard analysis pipelines in biology. We
show, however, that these methods fail to reconstruct local properties, such as
relative differences in densities (Fig. 1) and that apparent differences in
cluster size can arise from computational artifact caused by differing sample
sizes (Fig. 2). Providing a theoretical analysis of this issue, we then suggest
dtSNE, which approximately conserves local densities. In an extensive study on
synthetic benchmark and real world data comparing against five state-of-the-art
methods, we empirically show that dtSNE provides similar global reconstruction,
but yields much more accurate depictions of local distances and relative
densities.
- Abstract(参考訳): 低次元埋め込みと可視化は、高次元データの分析に欠かせないツールである。
tSNEやUMAPのような最先端の手法は、高次元データに隠された局所構造を明らかにするのに優れており、生物学の標準的な分析パイプラインに日常的に適用されている。
しかし,これらの手法は密度の相対的差(図1)のような局所的な性質を再構築することができないこと,また,サンプルサイズの違いによる計算的アーティファクトからクラスタサイズに明らかな差が生じること(図2)を示した。
この問題を理論的に解析し、局所密度をほぼ保存するdtSNEを提案する。
5つの最先端手法と比較した総合ベンチマークと実世界データに関する広範な研究において、dtsneは同様のグローバル再構築を提供するが、局所距離と相対密度をより正確に表現できることを示した。
関連論文リスト
- Dimensionality-Aware Outlier Detection: Theoretical and Experimental
Analysis [10.462432732238039]
本稿では,データセット内の次元の局所的変動をフルに考慮した非パラメトリックな外乱検出手法を提案する。
提案手法は,3つの重要なベンチマーク・アウトレイラ検出手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-01-10T01:07:35Z) - A Heat Diffusion Perspective on Geodesic Preserving Dimensionality
Reduction [66.21060114843202]
熱測地線埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法を提案する。
その結果,本手法は,地中真理多様体距離の保存において,既存の技術よりも優れていることがわかった。
また,連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-05-30T13:58:50Z) - Learning Topology-Preserving Data Representations [9.710409273484464]
位相保存データ表現(次元減少)を学習する手法を提案する。
この手法の中核は、元の高次元データと潜時空間における低次元表現との間の表現トポロジディバージェンス(RTD)の最小化である。
提案手法は, 線形相関, 三重項距離ランキング精度, 永続バーコード間のワッサーシュタイン距離によって測定された, 最先端の競合相手よりも, データ多様体のグローバル構造とトポロジーをよりよく保存する。
論文 参考訳(メタデータ) (2023-01-31T22:55:04Z) - Towards Understanding and Mitigating Dimensional Collapse in
Heterogeneous Federated Learning [114.32726625370258]
フェデレートラーニングは、プライバシを考慮したデータ共有を必要とせずに、さまざまなクライアントでモデルをトレーニングすることを目的としている。
本研究では,データの不均一性がグローバル集約モデルの表現に与える影響について検討する。
フェデレーション学習における次元的崩壊を効果的に緩和する新しい手法である sc FedDecorr を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:04:17Z) - Intrinsic Dimensionality Estimation within Tight Localities: A
Theoretical and Experimental Analysis [0.0]
そこで本研究では,20個のサンプル点からなるタイトな局所性に対しても安定な局所ID推定手法を提案する。
実験結果から,提案手法の偏差は比較的小さいが, 偏差は比較的小さく, 試料径は最先端の推定値よりもはるかに小さいことがわかった。
論文 参考訳(メタデータ) (2022-09-29T00:00:11Z) - Laplacian-based Cluster-Contractive t-SNE for High Dimensional Data
Visualization [20.43471678277403]
本稿では t-SNE に基づく新しいグラフベース次元削減手法 LaptSNE を提案する。
具体的には、LaptSNEはグラフラプラシアンの固有値情報を利用して、低次元埋め込みにおけるポテンシャルクラスタを縮小する。
ラプラシアン合成目的による最適化を考える際には、より広い関心を持つであろう勾配を解析的に計算する方法を示す。
論文 参考訳(メタデータ) (2022-07-25T14:10:24Z) - Incorporating Texture Information into Dimensionality Reduction for
High-Dimensional Images [65.74185962364211]
距離ベース次元削減手法に周辺情報を組み込む手法を提案する。
画像パッチを比較する異なる手法の分類に基づいて,様々なアプローチを探索する。
論文 参考訳(メタデータ) (2022-02-18T13:17:43Z) - HUMAP: Hierarchical Uniform Manifold Approximation and Projection [64.0476282000118]
HUMAPは、局所的・大域的構造と階層的探索を通してのメンタルマップの保存に柔軟に設計された、新しい階層的次元削減技術である。
本手法の優位性を示す実証的な証拠を,現在の階層的アプローチと比較し,その強みを示す2つのケーススタディを示す。
論文 参考訳(メタデータ) (2021-06-14T19:27:54Z) - A Local Similarity-Preserving Framework for Nonlinear Dimensionality
Reduction with Neural Networks [56.068488417457935]
本稿では,Vec2vecという新しい局所非線形手法を提案する。
ニューラルネットワークを訓練するために、マトリックスの近傍類似度グラフを構築し、データポイントのコンテキストを定義します。
8つの実データセットにおけるデータ分類とクラスタリングの実験により、Vec2vecは統計仮説テストにおける古典的な次元削減法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-03-10T23:10:47Z) - Joint Characterization of Multiscale Information in High Dimensional
Data [0.0]
グローバルアプローチとローカルアプローチの相乗効果を生かした多スケール共同評価手法を提案します。
関節の特徴は, PCA や t-sne のいずれからも明らかでない信号の検出と分離が可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T23:33:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。