論文の概要: G-CEALS: Gaussian Cluster Embedding in Autoencoder Latent Space for
Tabular Data Representation
- arxiv url: http://arxiv.org/abs/2301.00802v2
- Date: Thu, 5 Jan 2023 00:17:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 13:06:56.365784
- Title: G-CEALS: Gaussian Cluster Embedding in Autoencoder Latent Space for
Tabular Data Representation
- Title(参考訳): g-ceals: 表データ表現のためのオートエンコーダ潜在空間へのガウスクラスタ埋め込み
- Authors: Manar D. Samad, Sakib Abrar, Mohammad Bataineh
- Abstract要約: データビジュアライゼーションのために提案された近傍埋め込みの概念に着想を得たクラスタリングアルゴリズムを用いて、t分散埋め込みを共同学習することにより、画像データのクラスタリングのために、オートエンコーダの潜時空間が改善された。
本稿では,t分布を多変量ガウスクラスタに置き換えることで,自動エンコーダ遅延空間(G-CEALS)におけるガウスクラスタ埋め込みを提案する。
学習されたG-CEALSモデルは、未確認試験データの品質埋め込みを抽出し、埋め込みクラスタリング精度に基づいて、提案したG-CEALS法の平均ランクは1.4(0.7)であり、8つのベースラインクラスタリングよりも優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The latent space of autoencoders has been improved for clustering image data
by jointly learning a t-distributed embedding with a clustering algorithm
inspired by the neighborhood embedding concept proposed for data visualization.
However, multivariate tabular data pose different challenges in representation
learning than image data, where traditional machine learning is often superior
to deep tabular data learning. In this paper, we address the challenges of
learning tabular data in contrast to image data and present a novel Gaussian
Cluster Embedding in Autoencoder Latent Space (G-CEALS) algorithm by replacing
t-distributions with multivariate Gaussian clusters. Unlike current methods,
the proposed approach independently defines the Gaussian embedding and the
target cluster distribution to accommodate any clustering algorithm in
representation learning. A trained G-CEALS model extracts a quality embedding
for unseen test data. Based on the embedding clustering accuracy, the average
rank of the proposed G-CEALS method is 1.4 (0.7), which is superior to all
eight baseline clustering and cluster embedding methods on seven tabular data
sets. This paper shows one of the first algorithms to jointly learn embedding
and clustering to improve multivariate tabular data representation in
downstream clustering.
- Abstract(参考訳): データ可視化のために提案された近傍埋め込みの概念に触発されたクラスタリングアルゴリズムとt分布埋め込みを共同学習することにより、画像データのクラスタリングのためのオートエンコーダの潜在空間が改善されている。
しかし、多変量表データでは画像データとは異なる表現学習の課題が生まれ、従来の機械学習は深層表データ学習よりも優れていることが多い。
本稿では,画像データとは対照的に表データ学習の課題に対処し,t分布を多変量ガウスクラスターに置き換え,オートエンコーダ潜在空間(g-ceals)に埋め込みた新しいガウスクラスタを提案する。
現在の手法とは異なり、提案手法は表現学習において任意のクラスタリングアルゴリズムに対応するため、ガウス埋め込みと対象クラスタ分布を独立に定義する。
トレーニングされたG-CEALSモデルは、見えないテストデータに対する品質埋め込みを抽出する。
埋め込みクラスタリングの精度に基づき,提案手法の平均ランクは1.4 (0.7)であり,全8基クラスタリング法と7つの表付きデータセット上のクラスタ埋め込み法より優れている。
本稿では,ダウンストリームクラスタリングにおける多変量表データ表現を改善するために,組込みとクラスタリングを共同で学習する最初のアルゴリズムの1つを示す。
関連論文リスト
- Multilayer Graph Approach to Deep Subspace Clustering [0.0]
自己表現型モデル学習表現行列に基づくディープサブスペースクラスタリング(DSC)ネットワークは、完全に接続されたネットワークで実装されることが多い。
本稿では,入力データを含むエンコーダネットワークの全層から学習した表現から,選択した線形部分空間クラスタリングアルゴリズムを用いて表現を学習する。
ベースラインモデルとして2つのDSCネットワークを持つ4つのよく知られたデータセットに対して,提案手法を検証した。
論文 参考訳(メタデータ) (2024-01-30T14:09:41Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Progressive Sub-Graph Clustering Algorithm for Semi-Supervised Domain
Adaptation Speaker Verification [17.284276598514502]
マルチモデル投票と二重ガウスに基づく評価に基づく新しいプログレッシブサブグラフクラスタリングアルゴリズムを提案する。
破滅的なクラスタリング結果を防止するため、段階的にkを増大させ、二重ガウスに基づく評価アルゴリズムを用いる反復的手法を採用する。
論文 参考訳(メタデータ) (2023-05-22T04:26:18Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Clustering Plotted Data by Image Segmentation [12.443102864446223]
クラスタリングアルゴリズムは、ラベルなしデータのパターンを検出する主要な分析手法の1つである。
本稿では,人間のクラスタリングデータに着想を得た,2次元空間におけるクラスタリングポイントの全く異なる方法を提案する。
私たちのアプローチであるVisual Clusteringは、従来のクラスタリングアルゴリズムよりもいくつかのアドバンテージを持っています。
論文 参考訳(メタデータ) (2021-10-06T06:19:30Z) - Learning Statistical Representation with Joint Deep Embedded Clustering [2.1267423178232407]
StatDECは、共同統計表現学習とクラスタリングのための教師なしのフレームワークである。
実験により,これらの表現を用いることで,様々な画像データセットにまたがる不均衡な画像クラスタリングの結果を大幅に改善できることが示された。
論文 参考訳(メタデータ) (2021-09-11T09:26:52Z) - Learning Hierarchical Graph Neural Networks for Image Clustering [81.5841862489509]
本稿では,画像の集合を未知の個数にクラスタリングする方法を学ぶ階層型グラフニューラルネットワーク(GNN)モデルを提案する。
我々の階層的なGNNは、階層の各レベルで予測される連結コンポーネントをマージして、次のレベルで新しいグラフを形成するために、新しいアプローチを用いています。
論文 参考訳(メタデータ) (2021-07-03T01:28:42Z) - Very Compact Clusters with Structural Regularization via Similarity and
Connectivity [3.779514860341336]
本稿では,汎用データセットのためのエンドツーエンドのディープクラスタリングアルゴリズムであるVery Compact Clusters (VCC)を提案する。
提案手法は,最先端のクラスタリング手法よりも優れたクラスタリング性能を実現する。
論文 参考訳(メタデータ) (2021-06-09T23:22:03Z) - Graph Contrastive Clustering [131.67881457114316]
本稿では,クラスタリングタスクに適用可能な新しいグラフコントラスト学習フレームワークを提案し,gcc(graph constrastive clustering)法を考案した。
特に、グラフラプラシアンに基づくコントラスト損失は、より識別的かつクラスタリングフレンドリーな特徴を学ぶために提案されている。
一方で、よりコンパクトなクラスタリング割り当てを学ぶために、グラフベースのコントラスト学習戦略が提案されている。
論文 参考訳(メタデータ) (2021-04-03T15:32:49Z) - Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from
Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。
5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-08-23T08:25:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。