論文の概要: Supervised Dimensionality Reduction and Visualization using
Centroid-encoder
- arxiv url: http://arxiv.org/abs/2002.11934v2
- Date: Fri, 28 Feb 2020 23:22:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 07:22:28.258137
- Title: Supervised Dimensionality Reduction and Visualization using
Centroid-encoder
- Title(参考訳): セントロイドエンコーダを用いた高次元化と可視化
- Authors: Tomojit Ghosh and Michael Kirby
- Abstract要約: Centroid-Encoder (CE) メソッドはオートエンコーダに似ているが、ラベル情報を組み込んで、クラス内のオブジェクトを視覚化スペースを小さくする。
CEは、データのグローバルな構造を捉えながら、低次元の高分散を符号化するために非線形性やラベルを利用する。
我々は,データ分散が複数のモードにまたがる場合に,低次元空間におけるデータから大量の情報を抽出することを示す。
- 参考スコア(独自算出の注目度): 1.2487990897680423
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visualizing high-dimensional data is an essential task in Data Science and
Machine Learning. The Centroid-Encoder (CE) method is similar to the
autoencoder but incorporates label information to keep objects of a class close
together in the reduced visualization space. CE exploits nonlinearity and
labels to encode high variance in low dimensions while capturing the global
structure of the data. We present a detailed analysis of the method using a
wide variety of data sets and compare it with other supervised dimension
reduction techniques, including NCA, nonlinear NCA, t-distributed NCA,
t-distributed MCML, supervised UMAP, supervised PCA, Colored Maximum Variance
Unfolding, supervised Isomap, Parametric Embedding, supervised Neighbor
Retrieval Visualizer, and Multiple Relational Embedding. We empirically show
that centroid-encoder outperforms most of these techniques. We also show that
when the data variance is spread across multiple modalities, centroid-encoder
extracts a significant amount of information from the data in low dimensional
space. This key feature establishes its value to use it as a tool for data
visualization.
- Abstract(参考訳): 高次元データの可視化は、データサイエンスと機械学習において必須の課題である。
Centroid-Encoder (CE) メソッドはオートエンコーダと似ているが、ラベル情報を組み込んでクラス内のオブジェクトを視覚化空間に密に保持する。
CEは、データのグローバル構造を捉えながら、低次元の高分散を符号化するために非線形性とラベルを利用する。
本稿では,多種多様なデータセットを用いた手法の詳細な解析を行い,nca,非線形nca,t分布型nca,t分布型mcml,umap,pca,有色最大分散展開,教師付きisomap,パラメトリック埋め込み,教師付き近傍検索ビジュアライザ,複数の関係埋め込みを含む他の教師付き次元縮小手法と比較する。
実験により,Centroid-Encoderはこれらの技術よりも優れていることが示された。
また,データ分散が複数のモダリティに分散すると,centroid-encoderは低次元空間のデータからかなりの量の情報を抽出できることを示した。
この重要な機能は、データを視覚化するツールとして使う価値を確立します。
関連論文リスト
- Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Datacube segmentation via Deep Spectral Clustering [76.48544221010424]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - Asymmetric double-winged multi-view clustering network for exploring
Diverse and Consistent Information [28.300395619444796]
教師なしのシナリオでは、ディープコントラッシブ・マルチビュー・クラスタリング(DCMVC)がホットな研究スポットになりつつある。
我々はCodingNetと呼ばれる新しいマルチビュークラスタリングネットワークを提案し、多様な一貫した情報を同時に探索する。
フレームワークの有効性は、広く使用されている6つのベンチマークデータセットに関する広範な実験を通じて検証される。
論文 参考訳(メタデータ) (2023-09-01T14:13:22Z) - ShaRP: Shape-Regularized Multidimensional Projections [71.30697308446064]
本稿では,生成した散布板の視覚的シグネチャをユーザが明示的に制御できる新しいプロジェクション技術,ShaRPを提案する。
ShaRPは次元とデータセットサイズによく対応し、任意の定量的データセットを汎用的に処理する。
論文 参考訳(メタデータ) (2023-06-01T11:16:58Z) - Semi-Supervised Manifold Learning with Complexity Decoupled Chart Autoencoders [45.29194877564103]
本研究は、クラスラベルなどの半教師付き情報を付加できる非対称符号化復号プロセスを備えたチャートオートエンコーダを導入する。
このようなネットワークの近似力を議論し、周囲空間の次元ではなく、本質的にデータ多様体の内在次元に依存する境界を導出する。
論文 参考訳(メタデータ) (2022-08-22T19:58:03Z) - Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet
Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。
スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。
主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文 参考訳(メタデータ) (2022-01-07T22:26:33Z) - Scalable semi-supervised dimensionality reduction with GPU-accelerated
EmbedSOM [0.0]
BlosSOMは高次元データセットの対話型ユーザステアブル可視化のための高性能半教師付き次元減少ソフトウェアである。
現実的なデータセットにBlosSOMを適用することで、ユーザが指定したレイアウトを組み込んだ高品質な視覚化と、特定の機能に集中することが可能になる。
論文 参考訳(メタデータ) (2022-01-03T15:06:22Z) - Visual Cluster Separation Using High-Dimensional Sharpened
Dimensionality Reduction [65.80631307271705]
高次元シャープ化DR(HD-SDR)は、合成データセットと実世界のデータセットの両方で試験される。
提案手法は,高品質(品質指標による測定)を達成し,大規模高次元データを用いて計算的に精度よくスケールする。
具体的な応用を説明するため,近年の天文カタログにHD-SDRを適用した。
論文 参考訳(メタデータ) (2021-10-01T11:13:51Z) - Supervised Visualization for Data Exploration [9.742277703732187]
本稿では,無作為な森林確率と拡散に基づく次元減少に基づく新しい可視化手法について述べる。
我々のアプローチはノイズやパラメータのチューニングに頑健であり、データ探索のための信頼性の高い可視化を作成しながら、簡単に使用できる。
論文 参考訳(メタデータ) (2020-06-15T19:10:17Z) - Two-Dimensional Semi-Nonnegative Matrix Factorization for Clustering [50.43424130281065]
TS-NMFと呼ばれる2次元(2次元)データに対する新しい半負行列分解法を提案する。
前処理ステップで2次元データをベクトルに変換することで、データの空間情報に深刻なダメージを与える既存の手法の欠点を克服する。
論文 参考訳(メタデータ) (2020-05-19T05:54:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。