論文の概要: Clustering Ensemble Meets Low-rank Tensor Approximation
- arxiv url: http://arxiv.org/abs/2012.08916v1
- Date: Wed, 16 Dec 2020 13:01:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 03:08:27.611846
- Title: Clustering Ensemble Meets Low-rank Tensor Approximation
- Title(参考訳): クラスタリングアンサンブル - 低ランクテンソル近似
- Authors: Yuheng Jia, Hui Liu, Junhui Hou, Qingfu Zhang
- Abstract要約: 本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
- 参考スコア(独自算出の注目度): 50.21581880045667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper explores the problem of clustering ensemble, which aims to combine
multiple base clusterings to produce better performance than that of the
individual one. The existing clustering ensemble methods generally construct a
co-association matrix, which indicates the pairwise similarity between samples,
as the weighted linear combination of the connective matrices from different
base clusterings, and the resulting co-association matrix is then adopted as
the input of an off-the-shelf clustering algorithm, e.g., spectral clustering.
However, the co-association matrix may be dominated by poor base clusterings,
resulting in inferior performance. In this paper, we propose a novel low-rank
tensor approximation-based method to solve the problem from a global
perspective. Specifically, by inspecting whether two samples are clustered to
an identical cluster under different base clusterings, we derive a
coherent-link matrix, which contains limited but highly reliable relationships
between samples. We then stack the coherent-link matrix and the co-association
matrix to form a three-dimensional tensor, the low-rankness property of which
is further explored to propagate the information of the coherent-link matrix to
the co-association matrix, producing a refined co-association matrix. We
formulate the proposed method as a convex constrained optimization problem and
solve it efficiently. Experimental results over 7 benchmark data sets show that
the proposed model achieves a breakthrough in clustering performance, compared
with 12 state-of-the-art methods. To the best of our knowledge, this is the
first work to explore the potential of low-rank tensor on clustering ensemble,
which is fundamentally different from previous approaches.
- Abstract(参考訳): 本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
既存のクラスタリングアンサンブル法は一般に、異なる基底クラスタリングからの連結行列の重み付き線形結合としてサンプル間の対の類似性を示す共結合行列を構築し、結果として得られる共結合行列を、例えばスペクトルクラスタリングのようなオフ・ザ・セットクラスタリングアルゴリズムの入力として採用する。
しかし、共連想行列は、粗い塩基クラスタリングによって支配され、結果として性能は低下する。
本稿では,グローバルな視点から問題を解くために,新しい低ランクテンソル近似法を提案する。
具体的には、2つのサンプルが同一のクラスタに異なるベースクラスタでクラスタ化されているかどうかを調べることで、サンプル間の限定的かつ信頼性の高い関係を含むコヒーレントリンク行列を導出する。
次にコヒーレントリンク行列と共結合行列を積み重ねて3次元テンソルを形成する。低ランク性はコヒーレントリンク行列の情報を共結合行列に伝達するためにさらに研究され、洗練された共結合行列を生成する。
提案手法を凸制約最適化問題として定式化し,効率よく解く。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
我々の知る限りでは、これはクラスタリングアンサンブルにおける低ランクテンソルの可能性を探究する最初の試みであり、これは従来のアプローチと根本的に異なる。
関連論文リスト
- Similarity and Dissimilarity Guided Co-association Matrix Construction for Ensemble Clustering [22.280221709474105]
アンサンブルクラスタリングを実現するためにSDGCA(Simisity and Dissimilarity Guided Co-Association matrix)を提案する。
まず、各クラスタの品質を推定するために正規化アンサンブルエントロピーを導入し、この推定に基づいて類似度行列を構築した。
ランダムウォークを用いて、基底クラスタリングの高次近接を探索し、相似行列を構成する。
論文 参考訳(メタデータ) (2024-11-01T08:10:28Z) - Semi-Supervised Subspace Clustering via Tensor Low-Rank Representation [64.49871502193477]
本稿では,初期監視情報を同時に拡張し,識別親和性行列を構築することのできる,新しい半教師付きサブスペースクラスタリング手法を提案する。
6つの一般的なベンチマークデータセットの総合的な実験結果から,本手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-21T01:47:17Z) - Ensemble Clustering via Co-association Matrix Self-enhancement [16.928049559092454]
アンサンブルクラスタリングは、一連のベースクラスタリング結果を統合して、より強力なクラスタを生成する。
既存の手法は通常、同一のクラスタに2つのサンプルがグループ化された回数を測定する共連想行列(CA)に依存している。
本稿では, クラスタリング性能を向上させるために, CA行列を改善するための, 単純かつ効果的なCA行列自己拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-12T07:54:32Z) - Spatially Coherent Clustering Based on Orthogonal Nonnegative Matrix
Factorization [0.0]
本稿では,クラスタメンバシップ行列の総変動(TV)正規化手順に基づく作業クラスタリングモデルを紹介する。
マトリックス支援レーザー脱離イオン化イメージング測定から得られた超スペクトルデータセット上の提案手法をすべて数値的に評価する。
論文 参考訳(メタデータ) (2021-04-25T23:40:41Z) - Doubly Stochastic Subspace Clustering [9.815735805354905]
多くの最先端サブスペースクラスタリング法は、まずデータポイント間の親和性行列を構築し、その親和性にスペクトルクラスタリングを適用することによって、2段階のプロセスに従う。
本研究では、データの自己表現表現と、スペクトルクラスタリングによく正規化された親和性行列の両方を学習する。
実験により,コンピュータビジョンにおける多くの共通データセットに対して,最先端のサブスペースクラスタリング性能が得られた。
論文 参考訳(メタデータ) (2020-11-30T14:56:54Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Biclustering with Alternating K-Means [5.089110111757978]
本稿では,経験的クラスタリングリスクを最小限に抑えるというアイデアに基づいて,ビクラスタリング問題の新たな定式化について述べる。
カラムと行間のk-meansクラスタリングアルゴリズムの適応バージョンを交互に使用することにより,局所最小値を求める,単純で斬新なアルゴリズムを提案する。
その結果,本アルゴリズムは,データ中の有意義な構造を検知し,様々な設定や状況において競合する2クラスタリング手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-09-09T20:15:24Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文 参考訳(メタデータ) (2020-02-08T19:41:23Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。