論文の概要: Understanding How Dimension Reduction Tools Work: An Empirical Approach
to Deciphering t-SNE, UMAP, TriMAP, and PaCMAP for Data Visualization
- arxiv url: http://arxiv.org/abs/2012.04456v1
- Date: Tue, 8 Dec 2020 14:50:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-17 05:35:56.669662
- Title: Understanding How Dimension Reduction Tools Work: An Empirical Approach
to Deciphering t-SNE, UMAP, TriMAP, and PaCMAP for Data Visualization
- Title(参考訳): 次元削減ツールの動作方法を理解する:データ可視化のためのt-SNE, UMAP, TriMAP, PaCMAPの解読
- Authors: Yingfan Wang, Haiyang Huang, Cynthia Rudin, Yaron Shaposhnik
- Abstract要約: t-SNE、UMAP、TriMAPのような次元減少(DR)技術は、多くの実世界のデータセットで顕著な可視化性能を示している。
これらの方法に常に直面している緊張の1つは、グローバル構造の保存とローカル構造の保存のトレードオフです。
Pairwise Controlled Manifold Approximation Projection (PaCMAP)と呼ばれるDRの新しいアルゴリズムを設計するためにこれらの知見を活用する。
私たちの仕事は、DRアルゴリズムを構築する際の設計の選択と回避の両方について、予期せぬ洞察を提供します。
- 参考スコア(独自算出の注目度): 28.05893410353414
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Dimension reduction (DR) techniques such as t-SNE, UMAP, and TriMAP have
demonstrated impressive visualization performance on many real world datasets.
One tension that has always faced these methods is the trade-off between
preservation of global structure and preservation of local structure: these
methods can either handle one or the other, but not both. In this work, our
main goal is to understand what aspects of DR methods are important for
preserving both local and global structure: it is difficult to design a better
method without a true understanding of the choices we make in our algorithms
and their empirical impact on the lower-dimensional embeddings they produce.
Towards the goal of local structure preservation, we provide several useful
design principles for DR loss functions based on our new understanding of the
mechanisms behind successful DR methods. Towards the goal of global structure
preservation, our analysis illuminates that the choice of which components to
preserve is important. We leverage these insights to design a new algorithm for
DR, called Pairwise Controlled Manifold Approximation Projection (PaCMAP),
which preserves both local and global structure. Our work provides several
unexpected insights into what design choices both to make and avoid when
constructing DR algorithms.
- Abstract(参考訳): t-SNE、UMAP、TriMAPのような次元減少(DR)技術は、多くの実世界のデータセットで顕著な可視化性能を示している。
これらの方法が常に直面してきた緊張の1つは、グローバルな構造の保存とローカルな構造の保存のトレードオフである。
本研究の主な目的は,局所構造とグローバル構造の両方を保存する上で,DR手法のどの側面が重要であるかを理解することである。
局所構造保存の目的に向けて,我々はDR法の背後にあるメカニズムを新たに理解した上で,DR損失関数の設計原則をいくつか提示する。
地球構造保存の目的に向けて, 保存すべき成分の選択が重要であることを明らかにする。
これらの知見を活かして、局所構造と大域構造の両方を保存するペアワイズ制御多様体近似射影(pacmap)と呼ばれるdrの新しいアルゴリズムを設計する。
我々の研究は、DRアルゴリズムを構築する際に、どのような設計を選択し、避けるかという予期せぬ洞察を提供する。
関連論文リスト
- TopoFR: A Closer Look at Topology Alignment on Face Recognition [42.936929062768826]
PTSAと呼ばれるトポロジカル構造アライメント戦略とSDEという硬質試料マイニング戦略を利用する新しいFRモデルであるTopoFRを提案する。
PTSAは永続ホモロジーを用いて入力空間と潜在空間の位相構造を整列し、構造情報を効果的に保存し、FRモデルの一般化性能を向上させる。
一般的な顔のベンチマーク実験の結果は、最先端の手法よりもTopoFRの方が優れていることを示している。
論文 参考訳(メタデータ) (2024-10-14T14:58:30Z) - Towards a Unified View of Preference Learning for Large Language Models: A Survey [88.66719962576005]
大きな言語モデル(LLM)は、非常に強力な能力を示す。
成功するための重要な要因の1つは、LLMの出力を人間の好みに合わせることである。
選好学習のすべての戦略を、モデル、データ、フィードバック、アルゴリズムの4つの構成要素に分解する。
論文 参考訳(メタデータ) (2024-09-04T15:11:55Z) - Sailing in high-dimensional spaces: Low-dimensional embeddings through angle preservation [12.775562063735006]
高次元データの低次元埋め込み(LDE)は、科学や工学においてユビキタスである。
我々は,LDE学習の新たな視点として,データポイント間の角度を再構築することを提案する。
論文 参考訳(メタデータ) (2024-06-14T09:44:06Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from
Single-view RGB Images [78.56114271538061]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - Cluster Exploration using Informative Manifold Projections [0.0]
次元減少(DR)は、高次元データの視覚的探索の鍵となるツールの1つである。
本稿では,様々な事前知識に関連付けられた構造を抽出する情報埋め込みを生成する手法を提案する。
論文 参考訳(メタデータ) (2023-09-26T11:35:25Z) - Efficient Multi-View Graph Clustering with Local and Global Structure
Preservation [59.49018175496533]
局所・グローバル構造保存を用いた効率的なマルチビューグラフクラスタリング(EMVGC-LG)という,アンカーベースのマルチビューグラフクラスタリングフレームワークを提案する。
具体的には、EMVGC-LGがクラスタリング品質を向上させるために、アンカー構築とグラフ学習を共同で最適化する。
さらに、EMVGC-LGはサンプル数に関する既存のAMVGCメソッドの線形複雑性を継承する。
論文 参考訳(メタデータ) (2023-08-31T12:12:30Z) - Balancing between the Local and Global Structures (LGS) in Graph
Embedding [1.4732811715354455]
本稿では,グラフ埋め込みにおける局所構造とグローバル構造(LGS)のバランスをとる手法を提案する。
合成および実世界のデータセットを用いたLGSの性能評価を行い, 現状の手法と競合することを示す。
論文 参考訳(メタデータ) (2023-08-31T02:12:46Z) - Investigating Graph Structure Information for Entity Alignment with
Dangling Cases [31.779386064600956]
エンティティアライメントは、異なる知識グラフ(KG)における等価なエンティティを見つけることを目的としている。
Weakly-optimal Graph Contrastive Learning (WOGCL) と呼ばれる新しいエンティティアライメントフレームワークを提案する。
We show that WOGCL are outperforms the current-of-the-art method with pure structure information in traditional (relaxed) and dangling settings。
論文 参考訳(メタデータ) (2023-04-10T17:24:43Z) - GenURL: A General Framework for Unsupervised Representation Learning [58.59752389815001]
教師なし表現学習(URL)は、教師なしの高次元データのコンパクトな埋め込みを学習する。
本稿では,様々なURLタスクにスムーズに適応可能な類似性ベースの統合URLフレームワークGenURLを提案する。
実験により、GenURLは、自己教師付き視覚学習、無教師付き知識蒸留(KD)、グラフ埋め込み(GE)、次元縮小において、一貫した最先端性能を達成することが示された。
論文 参考訳(メタデータ) (2021-10-27T16:24:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。