論文の概要: Biclustering with Alternating K-Means
- arxiv url: http://arxiv.org/abs/2009.04550v3
- Date: Fri, 28 Jan 2022 18:40:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 08:56:48.643560
- Title: Biclustering with Alternating K-Means
- Title(参考訳): 交互K平均によるビクラスタリング
- Authors: Nicolas Fraiman, Zichao Li
- Abstract要約: 本稿では,経験的クラスタリングリスクを最小限に抑えるというアイデアに基づいて,ビクラスタリング問題の新たな定式化について述べる。
カラムと行間のk-meansクラスタリングアルゴリズムの適応バージョンを交互に使用することにより,局所最小値を求める,単純で斬新なアルゴリズムを提案する。
その結果,本アルゴリズムは,データ中の有意義な構造を検知し,様々な設定や状況において競合する2クラスタリング手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 5.089110111757978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biclustering is the task of simultaneously clustering the rows and columns of
the data matrix into different subgroups such that the rows and columns within
a subgroup exhibit similar patterns. In this paper, we consider the case of
producing block-diagonal biclusters. We provide a new formulation of the
biclustering problem based on the idea of minimizing the empirical clustering
risk. We develop and prove a consistency result with respect to the empirical
clustering risk. Since the optimization problem is combinatorial in nature,
finding the global minimum is computationally intractable. In light of this
fact, we propose a simple and novel algorithm that finds a local minimum by
alternating the use of an adapted version of the k-means clustering algorithm
between columns and rows. We evaluate and compare the performance of our
algorithm to other related biclustering methods on both simulated data and
real-world gene expression data sets. The results demonstrate that our
algorithm is able to detect meaningful structures in the data and outperform
other competing biclustering methods in various settings and situations.
- Abstract(参考訳): ビクラスタリングは、データマトリックスの行と列を、サブグループ内の行と列が同様のパターンを示すように、異なるサブグループに同時にクラスタ化するタスクである。
本稿では,ブロック対角二クラスターの生成事例について考察する。
我々は,経験的クラスタリングリスクを最小限に抑えるというアイデアに基づいて,ビクラスタリング問題の新たな定式化を行う。
経験的クラスタリングリスクに関して一貫性のある結果を開発し,証明する。
最適化問題は本質的に組合せ的であるため、大域的な最小値の探索は計算的に難解である。
そこで本研究では,カラムと行間のk-meansクラスタリングアルゴリズムの適応バージョンを交互に使用することにより,局所最小値を求める,シンプルで斬新なアルゴリズムを提案する。
我々は,シミュレーションデータと実世界の遺伝子発現データセットを用いて,アルゴリズムの性能を他のビクラスタリング手法と比較した。
その結果,本アルゴリズムは,データ中の有意義な構造を検知し,様々な設定や状況において競合する2クラスタリング手法より優れていることを示す。
関連論文リスト
- HBIC: A Biclustering Algorithm for Heterogeneous Datasets [0.0]
Biclusteringは、データマトリックス内で行と列を同時にクラスタすることを目的とした、教師なしの機械学習アプローチである。
複素異種データから有意義なビクラスタを発見することが可能な,HBICと呼ばれるビクラスタリング手法を提案する。
論文 参考訳(メタデータ) (2024-08-23T16:48:10Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Skew-Symmetric Adjacency Matrices for Clustering Directed Graphs [5.301300942803395]
カットベースの有向グラフ(グラフ)クラスタリングは、しばしばクラスタ内あるいはクラスタ間の疎結合を見つけることに焦点を当てる。
フローベースのクラスタリングでは、クラスタ間のエッジは一方向を向く傾向にあり、マイグレーションデータ、フードウェブ、トレーディングデータに見出されている。
論文 参考訳(メタデータ) (2022-03-02T20:07:04Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Contrastive Clustering [57.71729650297379]
本稿では,インスタンスレベルのコントラスト学習を明示的に行うContrastive Clustering (CC)を提案する。
特にCCは、CIFAR-10(CIFAR-100)データセット上で0.705(0.431)のNMIを達成しており、最高のベースラインと比較して最大19%(39%)のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-09-21T08:54:40Z) - Non-Exhaustive, Overlapping Co-Clustering: An Extended Analysis [32.15852903039789]
コクラスタリングの目標は、行のクラスタリングと2次元のデータ行列の列を同時に識別することである。
我々はNEO-CCアルゴリズムと呼ばれる効率的な反復アルゴリズムを開発した。
実験結果から,NEO-CCアルゴリズムは実世界のデータのコクラスタリング構造を効果的に捉えることができることがわかった。
論文 参考訳(メタデータ) (2020-04-24T04:39:14Z) - Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文 参考訳(メタデータ) (2020-02-08T19:41:23Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。