論文の概要: Non-Exhaustive, Overlapping Co-Clustering: An Extended Analysis
- arxiv url: http://arxiv.org/abs/2004.11530v1
- Date: Fri, 24 Apr 2020 04:39:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 02:59:33.208703
- Title: Non-Exhaustive, Overlapping Co-Clustering: An Extended Analysis
- Title(参考訳): 非排他的、重複するコクラスタリング:拡張解析
- Authors: Joyce Jiyoung Whang and Inderjit S. Dhillon
- Abstract要約: コクラスタリングの目標は、行のクラスタリングと2次元のデータ行列の列を同時に識別することである。
我々はNEO-CCアルゴリズムと呼ばれる効率的な反復アルゴリズムを開発した。
実験結果から,NEO-CCアルゴリズムは実世界のデータのコクラスタリング構造を効果的に捉えることができることがわかった。
- 参考スコア(独自算出の注目度): 32.15852903039789
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of co-clustering is to simultaneously identify a clustering of rows
as well as columns of a two dimensional data matrix. A number of co-clustering
techniques have been proposed including information-theoretic co-clustering and
the minimum sum-squared residue co-clustering method. However, most existing
co-clustering algorithms are designed to find pairwise disjoint and exhaustive
co-clusters while many real-world datasets contain not only a large overlap
between co-clusters but also outliers which should not belong to any
co-cluster. In this paper, we formulate the problem of Non-Exhaustive,
Overlapping Co-Clustering where both of the row and column clusters are allowed
to overlap with each other and outliers for each dimension of the data matrix
are not assigned to any cluster. To solve this problem, we propose intuitive
objective functions, and develop an an efficient iterative algorithm which we
call the NEO-CC algorithm. We theoretically show that the NEO-CC algorithm
monotonically decreases the proposed objective functions. Experimental results
show that the NEO-CC algorithm is able to effectively capture the underlying
co-clustering structure of real-world data, and thus outperforms
state-of-the-art clustering and co-clustering methods. This manuscript includes
an extended analysis of [21].
- Abstract(参考訳): 共クラスタ化の目的は、2次元データ行列の列と同様に行のクラスタリングを同時に識別することである。
情報理論コクラスタリングや最小2乗残差コクラスタリングなど,多数のコクラスタリング手法が提案されている。
しかし、既存のコクラスタリングアルゴリズムの多くは、ペアで不整合かつ網羅的なコクラスタを見つけるように設計されている一方、多くの実世界のデータセットは、コクラスタ間の大きな重複だけでなく、いかなるコクラスタにも属さないアウトリーも含んでいる。
本稿では、列クラスタと列クラスタの双方が重なり合うことを許容し、データマトリックスの各次元のアウトレイラが任意のクラスタに割り当てられない非排他的重複クラスタリングの問題を定式化する。
この問題を解決するため,直感的な目的関数を提案し,NEO-CCアルゴリズムと呼ばれる効率的な反復アルゴリズムを開発した。
理論的には、NEO-CCアルゴリズムは提案した目的関数を単調に減少させる。
実験結果から,NEO-CCアルゴリズムは実世界のデータのコクラスタリング構造を効果的に捉え,最先端のクラスタリングとコクラスタリングの手法よりも優れていることがわかった。
この写本は[21]の拡張分析を含んでいる。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Hybrid Fuzzy-Crisp Clustering Algorithm: Theory and Experiments [0.0]
本稿では,対象関数の線形項と2次項を組み合わせたファジィクロップクラスタリングアルゴリズムを提案する。
このアルゴリズムでは、クラスタへのデータポイントのメンバシップが、クラスタセンタから十分に離れていれば、自動的に正確にゼロに設定される。
提案アルゴリズムは、不均衡なデータセットの従来の手法よりも優れており、よりバランスの取れたデータセットと競合することができる。
論文 参考訳(メタデータ) (2023-03-25T05:27:26Z) - Convex Clustering through MM: An Efficient Algorithm to Perform
Hierarchical Clustering [1.0589208420411012]
本稿では,クラスタ融合と高効率更新方式を用いた反復アルゴリズムCCMMによる凸クラスタリングを提案する。
現在のデスクトップコンピュータでは、CCMMは、7次元空間に100万以上のオブジェクトを含む凸クラスタリング問題を効率的に解決する。
論文 参考訳(メタデータ) (2022-11-03T15:07:51Z) - Adaptively-weighted Integral Space for Fast Multiview Clustering [54.177846260063966]
線形複雑度に近い高速マルチビュークラスタリングのための適応重み付き積分空間(AIMC)を提案する。
特に、ビュー生成モデルは、潜在積分空間からのビュー観測を再構成するために設計されている。
いくつかの実世界のデータセットで実施された実験は、提案したAIMC法の優位性を確認した。
論文 参考訳(メタデータ) (2022-08-25T05:47:39Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Biclustering with Alternating K-Means [5.089110111757978]
本稿では,経験的クラスタリングリスクを最小限に抑えるというアイデアに基づいて,ビクラスタリング問題の新たな定式化について述べる。
カラムと行間のk-meansクラスタリングアルゴリズムの適応バージョンを交互に使用することにより,局所最小値を求める,単純で斬新なアルゴリズムを提案する。
その結果,本アルゴリズムは,データ中の有意義な構造を検知し,様々な設定や状況において競合する2クラスタリング手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-09-09T20:15:24Z) - Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from
Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。
5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-08-23T08:25:06Z) - Point-Set Kernel Clustering [11.093960688450602]
本稿では,オブジェクトとオブジェクトの集合との類似性を計算する,ポイントセットカーネルと呼ばれる新しい類似度尺度を提案する。
新たなクラスタリング手法は,大規模データセットを扱えるように,効率的かつ効率的であることを示す。
論文 参考訳(メタデータ) (2020-02-14T00:00:03Z) - Bi-objective Optimization of Biclustering with Binary Data [0.0]
クラスタリングは、いくつかの類似性基準に従って、データオブジェクトをクラスタと呼ばれるサブセットに分割する。
本稿では,クラスタの重複を許容する準クラスタリングについて論じる。
ビクラスタリングは、オブジェクトとフィーチャーを同時にグループ化し、特定のオブジェクトのグループに特別な機能のグループがあるようにします。
論文 参考訳(メタデータ) (2020-02-09T21:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。