論文の概要: Accelerated sparse Kernel Spectral Clustering for large scale data
clustering problems
- arxiv url: http://arxiv.org/abs/2310.13381v1
- Date: Fri, 20 Oct 2023 09:51:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 23:34:45.876217
- Title: Accelerated sparse Kernel Spectral Clustering for large scale data
clustering problems
- Title(参考訳): 大規模データクラスタリング問題に対するスパースカーネルスペクトルクラスタリングの高速化
- Authors: Mihaly Novak, Rocco Langone, Carlos Alzate, Johan Suykens
- Abstract要約: 本稿では、スパースマルチウェイカーネルスペクトルクラスタリング(KSC)の改良版について述べる。
元のアルゴリズムは、プライマリ・デュアルの最小二乗サポートベクターマシン(LS-SVM)フレームワークで定式化された重み付きカーネル主成分分析から導かれる。
次に、不完全コレスキー分解(ICD)に基づくカーネル行列の低階近似といわゆるreduced set法を組み合わせることにより、スパーシリティが達成される。
- 参考スコア(独自算出の注目度): 0.27257174044950283
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An improved version of the sparse multiway kernel spectral clustering (KSC)
is presented in this brief. The original algorithm is derived from weighted
kernel principal component (KPCA) analysis formulated within the primal-dual
least-squares support vector machine (LS-SVM) framework. Sparsity is achieved
then by the combination of the incomplete Cholesky decomposition (ICD) based
low rank approximation of the kernel matrix with the so called reduced set
method. The original ICD based sparse KSC algorithm was reported to be
computationally far too demanding, especially when applied on large scale data
clustering problems that actually it was designed for, which has prevented to
gain more than simply theoretical relevance so far. This is altered by the
modifications reported in this brief that drastically improve the computational
characteristics. Solving the alternative, symmetrized version of the
computationally most demanding core eigenvalue problem eliminates the necessity
of forming and SVD of large matrices during the model construction. This
results in solving clustering problems now within seconds that were reported to
require hours without altering the results. Furthermore, sparsity is also
improved significantly, leading to more compact model representation,
increasing further not only the computational efficiency but also the
descriptive power. These transform the original, only theoretically relevant
ICD based sparse KSC algorithm applicable for large scale practical clustering
problems. Theoretical results and improvements are demonstrated by
computational experiments on carefully selected synthetic data as well as on
real life problems such as image segmentation.
- Abstract(参考訳): 本稿では,sparse multiway kernel spectral clustering (ksc)の改良版について述べる。
元のアルゴリズムは、プリマル・デュアルの最小二乗サポートベクターマシン(LS-SVM)フレームワークで定式化された重み付きカーネル主成分(KPCA)分析から導かれる。
次に、不完全コレスキー分解(ICD)に基づくカーネル行列の低階近似といわゆるreduced set法を組み合わせることにより、スパーシリティが達成される。
もともとのICDベースのスパースKSCアルゴリズムは、特に実際に設計された大規模データクラスタリング問題に適用した場合、計算的に非常に要求されすぎており、これまでは単に理論上の関連性以上のものを得られなかった。
これは、計算特性を大幅に改善する、このブリーフで報告された修正によって変更される。
計算的に最も要求されるコア固有値問題の対称性付きバージョンを解くことで、モデル構築中に大きな行列の形成とSVDが不要になる。
これにより、結果を変更することなく数時間を要すると報告された数秒以内のクラスタリング問題の解決が可能になった。
さらに、空間性も大幅に改善され、よりコンパクトなモデル表現が可能となり、計算効率だけでなく記述力も向上する。
これらのアルゴリズムは、大規模クラスタリング問題に適用可能な元の、理論上のみ関係のあるICDベースのスパースKSCアルゴリズムを変換する。
画像セグメンテーションのような実生活問題と同様に、慎重に選択された合成データに対する計算実験により理論的結果と改善が示された。
関連論文リスト
- A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.12938977698988]
Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T07:24:11Z) - Multiple kernel concept factorization algorithm based on global fusion [9.931283387968856]
教師なし環境では、特定のデータセットに対して適切なカーネル関数を設計または選択するために、Globalized Multiple Kernel(GMKCF)と呼ばれる新しいアルゴリズムが提案された。
提案アルゴリズムは,Kernel K-Means(KKM), Spectral Clustering(SC), CF Kernel(KCF), Co-regularized Multi-view spectrum clustering(Coreg), Robust Multiple KKM(RMKKM)などのデータクラスタリングにおける比較アルゴリズムより優れている。
論文 参考訳(メタデータ) (2024-10-27T09:13:57Z) - An Efficient Algorithm for Clustered Multi-Task Compressive Sensing [60.70532293880842]
クラスタ化マルチタスク圧縮センシングは、複数の圧縮センシングタスクを解決する階層モデルである。
このモデルに対する既存の推論アルゴリズムは計算コストが高く、高次元ではうまくスケールしない。
本稿では,これらの共分散行列を明示的に計算する必要をなくし,モデル推論を大幅に高速化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-30T15:57:14Z) - ESSAformer: Efficient Transformer for Hyperspectral Image
Super-resolution [76.7408734079706]
単一ハイパースペクトル像超解像(単一HSI-SR)は、低分解能観測から高分解能ハイパースペクトル像を復元することを目的としている。
本稿では,1つのHSI-SRの繰り返し精製構造を持つESSA注目組込みトランスフォーマネットワークであるESSAformerを提案する。
論文 参考訳(メタデータ) (2023-07-26T07:45:14Z) - An Optimization-based Deep Equilibrium Model for Hyperspectral Image
Deconvolution with Convergence Guarantees [71.57324258813675]
本稿では,ハイパースペクトル画像のデコンボリューション問題に対処する新しい手法を提案する。
新しい最適化問題を定式化し、学習可能な正規化器をニューラルネットワークの形で活用する。
導出した反復解法は、Deep Equilibriumフレームワーク内の不動点計算問題として表現される。
論文 参考訳(メタデータ) (2023-06-10T08:25:16Z) - Regularization and Optimization in Model-Based Clustering [4.096453902709292]
k-平均アルゴリズムの変種は、本質的に同じ球面ガウスの混合と、そのような分布から大きく逸脱するデータに適合する。
一般のGMMに対してより効率的な最適化アルゴリズムを開発し、これらのアルゴリズムと正規化戦略を組み合わせ、過度な適合を避ける。
これらの結果から, GMM と k-means 法の間の現状に新たな光を当て, 一般 GMM をデータ探索に利用することが示唆された。
論文 参考訳(メタデータ) (2023-02-05T18:22:29Z) - Exploring the Algorithm-Dependent Generalization of AUPRC Optimization
with List Stability [107.65337427333064]
AUPRC(Area Under the Precision-Recall Curve)の最適化は、機械学習にとって重要な問題である。
本研究では, AUPRC最適化の単依存一般化における最初の試行について述べる。
3つの画像検索データセットの実験は、我々のフレームワークの有効性と健全性に言及する。
論文 参考訳(メタデータ) (2022-09-27T09:06:37Z) - k-MS: A novel clustering algorithm based on morphological reconstruction [0.0]
k-MSは最悪の場合、CPU並列k-Meansよりも高速である。
また、ミトーシスやTRICLUSTのような密度や形状に敏感な類似のクラスター化法よりも高速である。
論文 参考訳(メタデータ) (2022-08-30T16:55:21Z) - Fast and Provable Tensor Robust Principal Component Analysis via Scaled
Gradient Descent [30.299284742925852]
本稿では、テンソルロバスト主成分分析(RPCA)に取り組む。
希少な腐敗によって汚染された観測から低ランクのテンソルを回収することを目的としている。
提案アルゴリズムは, 最先端行列やテンソルRPCAアルゴリズムよりも, より優れた, よりスケーラブルな性能を実現する。
論文 参考訳(メタデータ) (2022-06-18T04:01:32Z) - SimpleMKKM: Simple Multiple Kernel K-means [49.500663154085586]
単純なマルチカーネルk-means(SimpleMKKM)と呼ばれる,単純で効果的なマルチカーネルクラスタリングアルゴリズムを提案する。
我々の基準は、カーネル係数とクラスタリング分割行列における難解な最小化最大化問題によって与えられる。
クラスタリング一般化誤差の観点から,SimpleMKKMの性能を理論的に解析する。
論文 参考訳(メタデータ) (2020-05-11T10:06:40Z) - Fast Kernel k-means Clustering Using Incomplete Cholesky Factorization [11.631064399465089]
カーネルベースのクラスタリングアルゴリズムは、データセット内の非線形構造を特定し、キャプチャすることができる。
線形クラスタリングよりも優れたパフォーマンスを実現することができる。
カーネルマトリックス全体の計算と保存は非常に大きなメモリを占有しているため、カーネルベースのクラスタリングが大規模なデータセットを扱うことは困難である。
論文 参考訳(メタデータ) (2020-02-07T15:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。