論文の概要: Ensemble Clustering via Co-association Matrix Self-enhancement
- arxiv url: http://arxiv.org/abs/2205.05937v1
- Date: Thu, 12 May 2022 07:54:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-13 14:28:56.801840
- Title: Ensemble Clustering via Co-association Matrix Self-enhancement
- Title(参考訳): Co-Association Matrix Self-Enhancementによるアンサンブルクラスタリング
- Authors: Yuheng Jia, Sirui Tao, Ran Wang, Yongheng Wang
- Abstract要約: アンサンブルクラスタリングは、一連のベースクラスタリング結果を統合して、より強力なクラスタを生成する。
既存の手法は通常、同一のクラスタに2つのサンプルがグループ化された回数を測定する共連想行列(CA)に依存している。
本稿では, クラスタリング性能を向上させるために, CA行列を改善するための, 単純かつ効果的なCA行列自己拡張フレームワークを提案する。
- 参考スコア(独自算出の注目度): 16.928049559092454
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ensemble clustering integrates a set of base clustering results to generate a
stronger one. Existing methods usually rely on a co-association (CA) matrix
that measures how many times two samples are grouped into the same cluster
according to the base clusterings to achieve ensemble clustering. However, when
the constructed CA matrix is of low quality, the performance will degrade. In
this paper, we propose a simple yet effective CA matrix self-enhancement
framework that can improve the CA matrix to achieve better clustering
performance. Specifically, we first extract the high-confidence (HC)
information from the base clusterings to form a sparse HC matrix. By
propagating the highly-reliable information of the HC matrix to the CA matrix
and complementing the HC matrix according to the CA matrix simultaneously, the
proposed method generates an enhanced CA matrix for better clustering.
Technically, the proposed model is formulated as a symmetric constrained convex
optimization problem, which is efficiently solved by an alternating iterative
algorithm with convergence and global optimum theoretically guaranteed.
Extensive experimental comparisons with twelve state-of-the-art methods on
eight benchmark datasets substantiate the effectiveness, flexibility and
efficiency of the proposed model in ensemble clustering. The codes and datasets
can be downloaded at https://github.com/Siritao/EC-CMS.
- Abstract(参考訳): Ensembleクラスタリングは、一連のベースクラスタリング結果を統合して、より強力なクラスタを生成する。
既存の手法は通常、アンサンブルクラスタリングを達成するために、2つのサンプルが同じクラスタに何回グループ化されるかを測定するコアソシエーション(CA)マトリックスに依存している。
しかし、構築されたCA行列が低品質である場合、性能は低下する。
本稿では,CA行列を改良し,クラスタリング性能を向上する,シンプルで効果的なCA行列自己拡張フレームワークを提案する。
具体的には、まずベースクラスタリングから高信頼(HC)情報を抽出し、スパースHC行列を形成する。
HCマトリクスの信頼性の高い情報をCAマトリクスに伝播し、同時にCAマトリクスに従ってHCマトリクスを補完することにより、より優れたクラスタリングのための強化CAマトリクスを生成する。
技術的には、提案モデルは対称的制約付き凸最適化問題として定式化され、収束と大域的最適条件の交互反復アルゴリズムにより効率よく解かれる。
アンサンブルクラスタリングにおけるモデルの有効性,柔軟性,効率性を検証した8つのベンチマークデータセットに対する12の最先端手法との比較実験を行った。
コードとデータセットはhttps://github.com/Siritao/EC-CMSでダウンロードできる。
関連論文リスト
- One-Step Late Fusion Multi-view Clustering with Compressed Subspace [31.70261517292954]
圧縮部分空間を用いたワンステップレイトフュージョンマルチビュークラスタリング(OS-LFMVC-CS)という統合フレームワークを提案する。
コンセンサス部分空間を用いて分割行列を整列し、分割融合を最適化し、融合分割行列を用いて離散ラベルの学習を指導する。
論文 参考訳(メタデータ) (2024-01-03T06:18:30Z) - Linear time Evidence Accumulation Clustering with KMeans [0.0]
この研究は、平均的なリンククラスタリングの振る舞いを模倣するトリックを記述する。
分割の密度を効率よく計算する方法を見つけ、二次的な複雑さから線形的な複雑さへのコストを削減した。
k平均結果は、計算コストを低く保ちながら、NMIの観点からは、最先端の技術に匹敵する。
論文 参考訳(メタデータ) (2023-11-15T14:12:59Z) - Deep Double Self-Expressive Subspace Clustering [7.875193047472789]
二重自己表現型サブスペースクラスタリングアルゴリズムを提案する。
提案アルゴリズムは最先端手法よりも優れたクラスタリングを実現することができる。
論文 参考訳(メタデータ) (2023-06-20T15:10:35Z) - Late Fusion Multi-view Clustering via Global and Local Alignment
Maximization [61.89218392703043]
マルチビュークラスタリング(MVC)は、異なるビューからの補完情報を最適に統合し、クラスタリング性能を改善する。
既存のアプローチの多くは、クラスタリングに最適な類似性行列を学ぶために、複数の事前定義された類似性を直接融合する。
これらの問題に対処するために、アライメントを通してレイトフュージョンMVCを提案する。
論文 参考訳(メタデータ) (2022-08-02T01:49:31Z) - Semi-Supervised Subspace Clustering via Tensor Low-Rank Representation [64.49871502193477]
本稿では,初期監視情報を同時に拡張し,識別親和性行列を構築することのできる,新しい半教師付きサブスペースクラスタリング手法を提案する。
6つの一般的なベンチマークデータセットの総合的な実験結果から,本手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-21T01:47:17Z) - Self-supervised Symmetric Nonnegative Matrix Factorization [82.59905231819685]
シンメトリー非負係数行列(SNMF)は、データクラスタリングの強力な方法であることを示した。
より良いクラスタリング結果を求めるアンサンブルクラスタリングにインスパイアされた,自己監視型SNMF(S$3$NMF)を提案する。
SNMFのコード特性に対する感度を、追加情報に頼らずに活用しています。
論文 参考訳(メタデータ) (2021-03-02T12:47:40Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。