論文の概要: A Self-Supervised Approach for Cluster Assessment of High-Dimensional
Data
- arxiv url: http://arxiv.org/abs/2306.00011v1
- Date: Mon, 29 May 2023 22:32:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 20:46:00.135028
- Title: A Self-Supervised Approach for Cluster Assessment of High-Dimensional
Data
- Title(参考訳): 高次元データのクラスタアセスメントのための自己監督的アプローチ
- Authors: Alokendu Mazumder, Pagadala Krishna Murthy, Punit Rathore
- Abstract要約: 複雑な画像データセットにおけるクラスタ構造評価のためのディープラーニングベースのフレームワークを提案する。
まず,自己教師型ディープニューラルネットワークを用いて,複雑なデータに対する代表的埋め込みを生成する。
次に、これらの低次元埋め込みをVAT/iVATアルゴリズムに供給し、基礎となるクラスタ構造を推定する。
- 参考スコア(独自算出の注目度): 2.088376060651494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating the number of clusters and underlying cluster structure in a
dataset is a crucial task. Real-world data are often unlabeled, complex and
high-dimensional, which makes it difficult for traditional clustering
algorithms to perform well. In recent years, a matrix reordering based
algorithm, called "visual assessment of tendency" (VAT), and its variants have
attracted many researchers from various domains to estimate the number of
clusters and inherent cluster structure present in the data. However, these
algorithms fail when applied to high-dimensional data due to the curse of
dimensionality, as they rely heavily on the notions of closeness and farness
between data points. To address this issue, we propose a deep-learning based
framework for cluster structure assessment in complex, image datasets. First,
our framework generates representative embeddings for complex data using a
self-supervised deep neural network, and then, these low-dimensional embeddings
are fed to VAT/iVAT algorithms to estimate the underlying cluster structure. In
this process, we ensured not to use any prior knowledge for the number of
clusters (i.e k). We present our results on four real-life image datasets, and
our findings indicate that our framework outperforms state-of-the-art VAT/iVAT
algorithms in terms of clustering accuracy and normalized mutual information
(NMI).
- Abstract(参考訳): クラスタの数とデータセットの基盤となるクラスタ構造を見積もることが重要なタスクです。
現実世界のデータはしばしばラベルがなく、複雑で、高次元であり、従来のクラスタリングアルゴリズムではうまく機能しない。
近年、「傾向の視覚的評価」(vat)と呼ばれる行列再順序付けに基づくアルゴリズムとその変種は、様々な領域の研究者を惹きつけ、データに存在するクラスター数と固有のクラスター構造を推定している。
しかし、これらのアルゴリズムは、データポイント間の近さと遠さの概念に大きく依存するため、次元性の呪いによって高次元データに適用されると失敗する。
本稿では,複雑な画像データセットにおけるクラスタ構造評価のためのディープラーニングフレームワークを提案する。
まず,自己教師付きディープニューラルネットワークを用いて,複雑なデータに対する代表的埋め込みを生成し,その低次元埋め込みをvat/ivatアルゴリズムに与えてクラスタ構造の推定を行う。
このプロセスでは、クラスタ数(すなわちk)に事前の知識を使用しないことを保証しました。
本研究の結果は,4つの実生活画像データセットにおいて,クラスタリング精度と正規化相互情報(NMI)の観点から,最先端のVAT/iVATアルゴリズムよりも優れた性能を示した。
関連論文リスト
- Unfolding ADMM for Enhanced Subspace Clustering of Hyperspectral Images [43.152314090830174]
本稿では,スパースサブスペースクラスタリングのためのマルチプライヤの交互方向法(ADMM)に基づく反復解法を展開させることにより,ハイパースペクトル画像(HSI)のための革新的なクラスタリングアーキテクチャを提案する。
提案手法は, 構造保存モジュールの一部として, K近傍近傍のアルゴリズムを用いて, HSIデータの構造特性をよく把握する。
論文 参考訳(メタデータ) (2024-04-10T15:51:46Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Multi-View Clustering via Semi-non-negative Tensor Factorization [120.87318230985653]
半負のテンソル因子分解(Semi-NTF)に基づく新しいマルチビュークラスタリングを開発する。
本モデルは、ビュー間の関係を直接考慮し、ビュー間の補完情報を利用する。
さらに,提案手法の最適化アルゴリズムを提案し,そのアルゴリズムが常に定常KKT点に収束することを数学的に証明する。
論文 参考訳(メタデータ) (2023-03-29T14:54:19Z) - DeepCluE: Enhanced Image Clustering via Multi-layer Ensembles in Deep
Neural Networks [53.88811980967342]
本稿では,Ensembles (DeepCluE) を用いたDeep Clusteringを提案する。
ディープニューラルネットワークにおける複数のレイヤのパワーを活用することで、ディープクラスタリングとアンサンブルクラスタリングのギャップを埋める。
6つの画像データセットの実験結果から、最先端のディープクラスタリングアプローチに対するDeepCluEの利点が確認されている。
論文 参考訳(メタデータ) (2022-06-01T09:51:38Z) - Very Compact Clusters with Structural Regularization via Similarity and
Connectivity [3.779514860341336]
本稿では,汎用データセットのためのエンドツーエンドのディープクラスタリングアルゴリズムであるVery Compact Clusters (VCC)を提案する。
提案手法は,最先端のクラスタリング手法よりも優れたクラスタリング性能を実現する。
論文 参考訳(メタデータ) (2021-06-09T23:22:03Z) - DAC: Deep Autoencoder-based Clustering, a General Deep Learning
Framework of Representation Learning [0.0]
dac,deep autoencoder-based clustering,深層ニューロンネットワークを用いてクラスタリング表現を学ぶためのデータ駆動フレームワークを提案する。
実験結果から,KMeansクラスタリングアルゴリズムの性能をさまざまなデータセット上で効果的に向上させることができた。
論文 参考訳(メタデータ) (2021-02-15T11:31:00Z) - Scattering Transform Based Image Clustering using Projection onto
Orthogonal Complement [2.0305676256390934]
本稿では,画像クラスタリングのための最先端,安定,高速なアルゴリズムであるProjected-Scattering Spectral Clustering (PSSC)を紹介する。
PSSCは、小さな画像の散乱変換の幾何学的構造を利用する新しい方法を含む。
実験の結果,PSSCは全ての浅層クラスタリングアルゴリズムの中で最良の結果が得られることがわかった。
論文 参考訳(メタデータ) (2020-11-23T17:59:03Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from
Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。
5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-08-23T08:25:06Z) - Improving k-Means Clustering Performance with Disentangled Internal
Representations [0.0]
本稿では,オートエンコーダの学習遅延符号表現の絡み合いを最適化する,シンプルなアプローチを提案する。
提案手法を用いて,MNISTデータセットでは96.2%,Fashion-MNISTデータセットでは85.6%,EMNIST Balancedデータセットでは79.2%,ベースラインモデルでは79.2%であった。
論文 参考訳(メタデータ) (2020-06-05T11:32:34Z) - Learning to Cluster Faces via Confidence and Connectivity Estimation [136.5291151775236]
重複する部分グラフを多数必要とせず,完全に学習可能なクラスタリングフレームワークを提案する。
提案手法はクラスタリングの精度を大幅に向上させ,その上で訓練した認識モデルの性能を向上させるが,既存の教師付き手法に比べて桁違いに効率的である。
論文 参考訳(メタデータ) (2020-04-01T13:39:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。