論文の概要: Scalable Robust Bayesian Co-Clustering with Compositional ELBOs
- arxiv url: http://arxiv.org/abs/2504.04079v2
- Date: Tue, 08 Apr 2025 18:02:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 09:45:11.006574
- Title: Scalable Robust Bayesian Co-Clustering with Compositional ELBOs
- Title(参考訳): 構成ELBOを用いたスケーラブルロバストベイズ共クラスタリング
- Authors: Ashwin Vinod, Chandrajit Bajaj,
- Abstract要約: 共クラスタリングは、両方の次元において有意義なグループを明らかにするために、インスタンスと機能の双対性を利用する。
本稿では,列クラスタと列クラスタを直接学習する,完全変動型クラスタリングフレームワークについて紹介する。
提案手法は, 従来のコクラスタリング手法の利点を保ちながら, 精度とロバスト性にも優れる。
- 参考スコア(独自算出の注目度): 2.6756996523251964
- License:
- Abstract: Co-clustering exploits the duality of instances and features to simultaneously uncover meaningful groups in both dimensions, often outperforming traditional clustering in high-dimensional or sparse data settings. Although recent deep learning approaches successfully integrate feature learning and cluster assignment, they remain susceptible to noise and can suffer from posterior collapse within standard autoencoders. In this paper, we present the first fully variational Co-clustering framework that directly learns row and column clusters in the latent space, leveraging a doubly reparameterized ELBO to improve gradient signal-to-noise separation. Our unsupervised model integrates a Variational Deep Embedding with a Gaussian Mixture Model (GMM) prior for both instances and features, providing a built-in clustering mechanism that naturally aligns latent modes with row and column clusters. Furthermore, our regularized end-to-end noise learning Compositional ELBO architecture jointly reconstructs the data while regularizing against noise through the KL divergence, thus gracefully handling corrupted or missing inputs in a single training pipeline. To counteract posterior collapse, we introduce a scale modification that increases the encoder's latent means only in the reconstruction pathway, preserving richer latent representations without inflating the KL term. Finally, a mutual information-based cross-loss ensures coherent co-clustering of rows and columns. Empirical results on diverse real-world datasets from multiple modalities, numerical, textual, and image-based, demonstrate that our method not only preserves the advantages of prior Co-clustering approaches but also exceeds them in accuracy and robustness, particularly in high-dimensional or noisy settings.
- Abstract(参考訳): 共クラスタリングは、インスタンスと機能の双対性を利用して、両方の次元で意味のあるグループを同時に発見する。
最近のディープラーニングアプローチは、機能学習とクラスタ割り当てをうまく統合しているが、ノイズの影響を受けやすいままであり、標準オートエンコーダ内の後部崩壊に悩まされる可能性がある。
本稿では,遅延空間における行と列のクラスタを直接学習し,2重に再パラメータ化されたELBOを利用して勾配信号と雑音の分離を改善する,最初の完全変動型クラスタリングフレームワークを提案する。
我々の教師なしモデルは、インスタンスと機能の両方に先立って、変分深層埋め込みとガウス混合モデル(GMM)を統合し、ラテントモードと行と列クラスタを自然に整列する組込みクラスタリング機構を提供します。
さらに、我々の正規化エンドツーエンドのノイズ学習構成ELBOアーキテクチャは、KL分散によるノイズに対して規則化しながらデータを共同で再構成し、単一のトレーニングパイプラインにおいて、劣化または欠落した入力を適切に処理する。
KL項を膨らませることなく、よりリッチな潜伏表現を保ち、エンコーダの潜伏手段を増大させるスケール修正を導入する。
最後に、相互情報に基づくクロスロスにより、行と列のコヒーレントなクラスタリングが保証される。
複数のモーダル性、数値、テキスト、画像に基づく多様な実世界のデータセットに対する実証的な結果から、我々の手法は、従来のコクラスタリングアプローチの利点を保存できるだけでなく、特に高次元またはノイズの多い設定において、それらを精度と堅牢性で超えることを示した。
関連論文リスト
- Anchor Learning with Potential Cluster Constraints for Multi-view Clustering [11.536710289572552]
Anchor-based multi-view clustering (MVC) は、その効率性から注目されている。
本稿では,マルチビュークラスタリング (ALPC) 法に対する潜在的クラスタ制約付きアンカーラーニング法を提案する。
論文 参考訳(メタデータ) (2024-12-21T07:43:05Z) - Revisiting Self-Supervised Heterogeneous Graph Learning from Spectral Clustering Perspective [52.662463893268225]
自己教師付きヘテロジニアスグラフ学習(SHGL)は様々なシナリオにおいて有望な可能性を示している。
既存のSHGLメソッドには2つの大きな制限がある。
ランクと二重整合性制約によって強化された新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2024-12-01T09:33:20Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - End-to-end Differentiable Clustering with Associative Memories [23.618514621460694]
クラスタリングは、集中的な離散最適化問題を含む、広く使われている教師なし学習手法である。
本稿では,離散クラスタリング問題の非拘束的連続緩和を提案し,ClAMと呼ばれるAMによるエンドツーエンドの微分可能なクラスタリングを実現する。
各種データセットに対する評価では、ClAMは自己スーパービジョンの恩恵を受けており、従来のロイドのk平均アルゴリズムと、より最近の連続的なクラスタリング緩和(シルエット係数の60%まで)の両方で大幅に改善されていることが示されている。
論文 参考訳(メタデータ) (2023-06-05T19:34:36Z) - Likelihood Adjusted Semidefinite Programs for Clustering Heterogeneous
Data [16.153709556346417]
クラスタリングは広くデプロイされた学習ツールである。
iLA-SDPはEMよりも感度が低く、高次元データでは安定である。
論文 参考訳(メタデータ) (2022-09-29T21:03:13Z) - Adaptively-weighted Integral Space for Fast Multiview Clustering [54.177846260063966]
線形複雑度に近い高速マルチビュークラスタリングのための適応重み付き積分空間(AIMC)を提案する。
特に、ビュー生成モデルは、潜在積分空間からのビュー観測を再構成するために設計されている。
いくつかの実世界のデータセットで実施された実験は、提案したAIMC法の優位性を確認した。
論文 参考訳(メタデータ) (2022-08-25T05:47:39Z) - Tight integration of neural- and clustering-based diarization through
deep unfolding of infinite Gaussian mixture model [84.57667267657382]
本稿では,統合フレームワークにトレーニング可能なクラスタリングアルゴリズムを導入する。
話者埋め込みはトレーニング中に最適化され、iGMMクラスタリングに適合する。
実験の結果,提案手法はダイアリゼーション誤差率において従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-02-14T07:45:21Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - Correlation Clustering Reconstruction in Semi-Adversarial Models [70.11015369368272]
相関クラスタリングは多くのアプリケーションにおいて重要なクラスタリング問題である。
本研究では,ランダムノイズや対向的な修正によって崩壊した潜伏クラスタリングを再構築しようとする,この問題の再構築版について検討する。
論文 参考訳(メタデータ) (2021-08-10T14:46:17Z) - Deep Conditional Gaussian Mixture Model for Constrained Clustering [7.070883800886882]
制約付きクラスタリングは、部分的にラベル付けされたデータの増加量に関する事前情報を利用することができる。
本稿では、直感的で解釈可能で、勾配変動推論の枠組みで効率的に訓練できる制約付きクラスタリングのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T13:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。