論文の概要: Stochastic Cluster Embedding
- arxiv url: http://arxiv.org/abs/2108.08003v1
- Date: Wed, 18 Aug 2021 07:07:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-19 14:33:02.810930
- Title: Stochastic Cluster Embedding
- Title(参考訳): 確率的クラスタ埋め込み
- Authors: Zhirong Yang, Yuwei Chen, Denis Sedov, Samuel Kaski, and Jukka
Corander
- Abstract要約: Neighbor Embedding (NE)は、データ項目間のペアの類似性を維持することを目的としている。
Neighbor Embedding (SNE)のようなNEメソッドは、クラスタなどの大規模パターンを隠蔽する可能性がある。
隣り合う埋め込みに基づく新しいクラスタ可視化手法を提案する。
- 参考スコア(独自算出の注目度): 14.485496311015398
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neighbor Embedding (NE) that aims to preserve pairwise similarities between
data items has been shown to yield an effective principle for data
visualization. However, even the currently best NE methods such as Stochastic
Neighbor Embedding (SNE) may leave large-scale patterns such as clusters hidden
despite of strong signals being present in the data. To address this, we
propose a new cluster visualization method based on Neighbor Embedding. We
first present a family of Neighbor Embedding methods which generalizes SNE by
using non-normalized Kullback-Leibler divergence with a scale parameter. In
this family, much better cluster visualizations often appear with a parameter
value different from the one corresponding to SNE. We also develop an efficient
software which employs asynchronous stochastic block coordinate descent to
optimize the new family of objective functions. The experimental results
demonstrate that our method consistently and substantially improves
visualization of data clusters compared with the state-of-the-art NE
approaches.
- Abstract(参考訳): データアイテム間のペア方向の類似性を維持することを目的としたNeighbor Embedding(NE)が,データ視覚化に有効な原則であることが示された。
しかし、SNE(Stochastic Neighbor Embedding)のような現在最も優れたNE手法でさえ、データに強い信号が存在するにもかかわらず、クラスタのような大規模パターンを隠しておくことができる。
そこで本研究では,Neighbor Embeddingに基づくクラスタ可視化手法を提案する。
まず,非正規化Kulback-Leibler分散をスケールパラメータとして用いてSNEを一般化するNeighbor Embedding法を提案する。
このファミリーでは、より優れたクラスタ視覚化は、しばしばSNEに対応するものと異なるパラメータ値で現れる。
また,非同期確率ブロック座標を用いた効率的なソフトウェアを開発し,目的関数の新しいファミリーを最適化する。
実験結果から,本手法は最先端のNE手法と比較してデータクラスタの可視化を一貫して,実質的に改善することが示された。
関連論文リスト
- Revisiting Nonlocal Self-Similarity from Continuous Representation [62.06288797179193]
非局所的自己相似性(NSS)は、多次元データ処理タスクにうまく適用された重要な前駆体である。
オンメシュグリッドデータとオフメシュグリッドデータの両方に対して,連続表現に基づく新しい非局所法(CRNL)を提案する。
論文 参考訳(メタデータ) (2024-01-01T09:25:03Z) - Supervised Stochastic Neighbor Embedding Using Contrastive Learning [4.560284382063488]
同じクラスに属するサンプルのクラスタは、低次元の埋め込み空間にまとめられる。
我々は、自己教師付きコントラスト的アプローチを完全教師付き設定に拡張し、ラベル情報を効果的に活用する。
論文 参考訳(メタデータ) (2023-09-15T00:26:21Z) - Learn to Cluster Faces with Better Subgraphs [13.511058277653122]
顔クラスタリングは、巨大な未ラベルの顔データに擬似ラベルを提供することができる。
既存のクラスタリング手法は、均一な閾値や学習されたカットオフ位置に基づいて、サブグラフ内の特徴を集約する。
本研究は、ノイズを著しく低減できる効率的な近傍対応サブグラフ調整法を提案する。
論文 参考訳(メタデータ) (2023-04-21T09:18:55Z) - Multi-View Clustering via Semi-non-negative Tensor Factorization [120.87318230985653]
半負のテンソル因子分解(Semi-NTF)に基づく新しいマルチビュークラスタリングを開発する。
本モデルは、ビュー間の関係を直接考慮し、ビュー間の補完情報を利用する。
さらに,提案手法の最適化アルゴリズムを提案し,そのアルゴリズムが常に定常KKT点に収束することを数学的に証明する。
論文 参考訳(メタデータ) (2023-03-29T14:54:19Z) - Revised Conditional t-SNE: Looking Beyond the Nearest Neighbors [6.918364447822299]
Conditional t-SNE (ct-SNE) は、既知のクラスタ情報を埋め込みから削除できる t-SNE の最近の拡張である。
ct-SNEは多くの現実的な設定で失敗することを示す。
低次元の類似性の代わりに,高次元の類似性を条件づけた修正手法を導入する。
論文 参考訳(メタデータ) (2023-02-07T14:37:44Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Index $t$-SNE: Tracking Dynamics of High-Dimensional Datasets with
Coherent Embeddings [1.7188280334580195]
本稿では,クラスタの位置を保存した新しいものを作成するために,埋め込みを再利用する手法を提案する。
提案アルゴリズムは,新しい項目を埋め込むために$t$-SNEと同じ複雑さを持つ。
論文 参考訳(メタデータ) (2021-09-22T06:45:37Z) - Variational Auto Encoder Gradient Clustering [0.0]
近年,ディープニューラルネットワークモデルを用いたクラスタリングが広く研究されている。
本稿では、より良いクラスタリングを実現するために確率関数勾配上昇を使用してデータを処理する方法を検討する。
DBSCANクラスタリングアルゴリズムに基づいて,データに適したクラスタ数を調べるための簡便かつ効果的な方法を提案する。
論文 参考訳(メタデータ) (2021-05-11T08:00:36Z) - Contrastive Clustering [57.71729650297379]
本稿では,インスタンスレベルのコントラスト学習を明示的に行うContrastive Clustering (CC)を提案する。
特にCCは、CIFAR-10(CIFAR-100)データセット上で0.705(0.431)のNMIを達成しており、最高のベースラインと比較して最大19%(39%)のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-09-21T08:54:40Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。