論文の概要: Fast Kernel k-means Clustering Using Incomplete Cholesky Factorization
- arxiv url: http://arxiv.org/abs/2002.02846v1
- Date: Fri, 7 Feb 2020 15:32:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 03:49:40.545995
- Title: Fast Kernel k-means Clustering Using Incomplete Cholesky Factorization
- Title(参考訳): 不完全コレスキー分解を用いた高速カーネルk平均クラスタリング
- Authors: Li Chen, Shuisheng Zhou, Jiajun Ma
- Abstract要約: カーネルベースのクラスタリングアルゴリズムは、データセット内の非線形構造を特定し、キャプチャすることができる。
線形クラスタリングよりも優れたパフォーマンスを実現することができる。
カーネルマトリックス全体の計算と保存は非常に大きなメモリを占有しているため、カーネルベースのクラスタリングが大規模なデータセットを扱うことは困難である。
- 参考スコア(独自算出の注目度): 11.631064399465089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Kernel-based clustering algorithm can identify and capture the non-linear
structure in datasets, and thereby it can achieve better performance than
linear clustering. However, computing and storing the entire kernel matrix
occupy so large memory that it is difficult for kernel-based clustering to deal
with large-scale datasets. In this paper, we employ incomplete Cholesky
factorization to accelerate kernel clustering and save memory space. The key
idea of the proposed kernel $k$-means clustering using incomplete Cholesky
factorization is that we approximate the entire kernel matrix by the product of
a low-rank matrix and its transposition. Then linear $k$-means clustering is
applied to columns of the transpose of the low-rank matrix. We show both
analytically and empirically that the performance of the proposed algorithm is
similar to that of the kernel $k$-means clustering algorithm, but our method
can deal with large-scale datasets.
- Abstract(参考訳): カーネルベースのクラスタリングアルゴリズムは、データセット内の非線形構造を識別してキャプチャすることができ、リニアクラスタリングよりも優れたパフォーマンスを実現することができる。
しかし、カーネルマトリックス全体の計算と保存は非常に大きなメモリを占めるため、カーネルベースのクラスタリングが大規模なデータセットを扱うことは困難である。
本稿では,カーネルクラスタリングを高速化し,メモリ空間を節約するために,不完全なコレスキー分解を用いる。
不完全コレスキー分解を用いたカーネル$k$-meansクラスタリングの鍵となるアイデアは、カーネル行列全体の低ランク行列の積とその変換によって近似することである。
すると、線形な$k$-meansクラスタリングが、低ランク行列の転置の列に適用される。
我々は,提案アルゴリズムの性能がカーネル$k$-meansクラスタリングアルゴリズムと似ていることを解析的および実証的に示すが,本手法は大規模データセットを扱うことができる。
関連論文リスト
- Multiple kernel concept factorization algorithm based on global fusion [9.931283387968856]
教師なし環境では、特定のデータセットに対して適切なカーネル関数を設計または選択するために、Globalized Multiple Kernel(GMKCF)と呼ばれる新しいアルゴリズムが提案された。
提案アルゴリズムは,Kernel K-Means(KKM), Spectral Clustering(SC), CF Kernel(KCF), Co-regularized Multi-view spectrum clustering(Coreg), Robust Multiple KKM(RMKKM)などのデータクラスタリングにおける比較アルゴリズムより優れている。
論文 参考訳(メタデータ) (2024-10-27T09:13:57Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Local Sample-weighted Multiple Kernel Clustering with Consensus
Discriminative Graph [73.68184322526338]
マルチカーネルクラスタリング(MKC)は、ベースカーネルの集合から最適な情報融合を実現するためにコミットされる。
本稿では,新しい局所サンプル重み付きマルチカーネルクラスタリングモデルを提案する。
実験により, LSWMKCはより優れた局所多様体表現を有し, 既存のカーネルやグラフベースのクラスタリングアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2022-07-05T05:00:38Z) - k-Factorization Subspace Clustering [12.18340575383456]
サブスペースクラスタリングは、低次元部分空間の結合にあるデータをクラスタ化する。
本稿では,大規模サブスペースクラスタリングのためのk-Factorization Subspace Clustering (k-FSC) 法を提案する。
論文 参考訳(メタデータ) (2020-12-08T10:34:21Z) - Adaptive Explicit Kernel Minkowski Weighted K-means [1.3535770763481905]
カーネル K-平均は、K-平均をカーネル空間に拡張し、非線形構造を捉えることができ、任意の形状のクラスターを識別することができる。
本稿では, 線形および非線形アプローチの利点を, 駆動された対応する有限次元特徴写像を用いて組み合わせる手法を提案する。
論文 参考訳(メタデータ) (2020-12-04T19:14:09Z) - Kernel k-Means, By All Means: Algorithms and Strong Consistency [21.013169939337583]
Kernel $k$クラスタリングは、非線形データの教師なし学習のための強力なツールである。
本稿では,最適化された局所解に対処するための一般的な手法を応用した結果を一般化する。
我々のアルゴリズムは、この非線形分離問題をよりよく解くために、Magricalization-minimization (MM) を利用している。
論文 参考訳(メタデータ) (2020-11-12T16:07:18Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - SimpleMKKM: Simple Multiple Kernel K-means [49.500663154085586]
単純なマルチカーネルk-means(SimpleMKKM)と呼ばれる,単純で効果的なマルチカーネルクラスタリングアルゴリズムを提案する。
我々の基準は、カーネル係数とクラスタリング分割行列における難解な最小化最大化問題によって与えられる。
クラスタリング一般化誤差の観点から,SimpleMKKMの性能を理論的に解析する。
論文 参考訳(メタデータ) (2020-05-11T10:06:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。