論文の概要: Minimax-Optimal Covariance Projected Spectral Clustering for High-Dimensional Nonspherical Mixtures
- arxiv url: http://arxiv.org/abs/2502.02580v1
- Date: Tue, 04 Feb 2025 18:55:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:57:25.664223
- Title: Minimax-Optimal Covariance Projected Spectral Clustering for High-Dimensional Nonspherical Mixtures
- Title(参考訳): 高次元非球面混合系の最小共分散射影スペクトルクラスタリング
- Authors: Chengzhu Huang, Yuqi Gu,
- Abstract要約: 各クラスタ内の非球面(異方性)ノイズは、実世界のデータに広く存在している。
本研究では,高次元非球面混合モデルに基づくクラスタリングにおける最小値と最適統計手法について検討した。
- 参考スコア(独自算出の注目度): 1.4502611532302039
- License:
- Abstract: In mixture models, nonspherical (anisotropic) noise within each cluster is widely present in real-world data. We study both the minimax rate and optimal statistical procedure for clustering under high-dimensional nonspherical mixture models. In high-dimensional settings, we first establish the information-theoretic limits for clustering under Gaussian mixtures. The minimax lower bound unveils an intriguing informational dimension-reduction phenomenon: there exists a substantial gap between the minimax rate and the oracle clustering risk, with the former determined solely by the projected centers and projected covariance matrices in a low-dimensional space. Motivated by the lower bound, we propose a novel computationally efficient clustering method: Covariance Projected Spectral Clustering (COPO). Its key step is to project the high-dimensional data onto the low-dimensional space spanned by the cluster centers and then use the projected covariance matrices in this space to enhance clustering. We establish tight algorithmic upper bounds for COPO, both for Gaussian noise with flexible covariance and general noise with local dependence. Our theory indicates the minimax-optimality of COPO in the Gaussian case and highlights its adaptivity to a broad spectrum of dependent noise. Extensive simulation studies under various noise structures and real data analysis demonstrate our method's superior performance.
- Abstract(参考訳): 混合モデルでは、各クラスタ内の非球面(異方性)ノイズは実世界のデータに広く存在する。
本研究では,高次元非球面混合モデルに基づくクラスタリングにおける最小値と最適統計手法について検討した。
高次元設定では、まずガウス混合下でのクラスタリングにおける情報理論の限界を確立する。
ミニマックスの下位境界は、ミニマックスレートとオラクルクラスタリングリスクの間には実質的なギャップがあり、前者は投影された中心と低次元空間における射影された共分散行列によってのみ決定される。
そこで本研究では,共分散射影スペクトルクラスタリング(COPO)という,計算効率のよいクラスタリング手法を提案する。
その鍵となるステップは、クラスター中心にまたがる低次元空間に高次元データを投影し、この空間に投影された共分散行列を用いてクラスタリングを強化することである。
フレキシブルな共分散を持つガウス雑音と局所的依存を持つ一般雑音の両方に対して,COPOの厳密なアルゴリズム上界を確立する。
我々の理論は、ガウスの場合のCOPOの極小最適性を示し、依存雑音の広いスペクトルへの適応性を強調している。
各種ノイズ構造と実データ解析に基づく広範囲なシミュレーション研究により,本手法の優れた性能が実証された。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Clustering based on Mixtures of Sparse Gaussian Processes [6.939768185086753]
低次元の組込み空間を使ってデータをクラスタする方法は、マシンラーニングにおいて依然として難しい問題である。
本稿では,クラスタリングと次元還元の両立を目的とした共同定式化を提案する。
我々のアルゴリズムはスパースガウス過程の混合に基づいており、スパースガウス過程混合クラスタリング(SGP-MIC)と呼ばれる。
論文 参考訳(メタデータ) (2023-03-23T20:44:36Z) - Likelihood Adjusted Semidefinite Programs for Clustering Heterogeneous
Data [16.153709556346417]
クラスタリングは広くデプロイされた学習ツールである。
iLA-SDPはEMよりも感度が低く、高次元データでは安定である。
論文 参考訳(メタデータ) (2022-09-29T21:03:13Z) - Adaptively-weighted Integral Space for Fast Multiview Clustering [54.177846260063966]
線形複雑度に近い高速マルチビュークラスタリングのための適応重み付き積分空間(AIMC)を提案する。
特に、ビュー生成モデルは、潜在積分空間からのビュー観測を再構成するために設計されている。
いくつかの実世界のデータセットで実施された実験は、提案したAIMC法の優位性を確認した。
論文 参考訳(メタデータ) (2022-08-25T05:47:39Z) - Optimal Clustering by Lloyd Algorithm for Low-Rank Mixture Model [12.868722327487752]
行列値の観測を行うために低ランク混合モデル(LrMM)を提案する。
ロイドのアルゴリズムと低ランク近似を統合して計算効率のよいクラスタリング法を設計する。
本手法は,実世界のデータセットにおける文献上の他者よりも優れる。
論文 参考訳(メタデータ) (2022-07-11T03:16:10Z) - Tight integration of neural- and clustering-based diarization through
deep unfolding of infinite Gaussian mixture model [84.57667267657382]
本稿では,統合フレームワークにトレーニング可能なクラスタリングアルゴリズムを導入する。
話者埋め込みはトレーニング中に最適化され、iGMMクラスタリングに適合する。
実験の結果,提案手法はダイアリゼーション誤差率において従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-02-14T07:45:21Z) - Minimax Supervised Clustering in the Anisotropic Gaussian Mixture Model:
A new take on Robust Interpolation [5.98367009147573]
2成分異方性ガウス混合モデルに基づくクラスタリング問題について検討する。
その結果, 線形判別分析(LDA)分類器は, ミニマックス感において準最適であることが判明した。
論文 参考訳(メタデータ) (2021-11-13T05:19:37Z) - Density-Based Clustering with Kernel Diffusion [59.4179549482505]
単位$d$次元ユークリッド球のインジケータ関数に対応するナイーブ密度は、密度に基づくクラスタリングアルゴリズムで一般的に使用される。
局所分布特性と滑らかさの異なるデータに適応する新しいカーネル拡散密度関数を提案する。
論文 参考訳(メタデータ) (2021-10-11T09:00:33Z) - Optimal Clustering in Anisotropic Gaussian Mixture Models [3.5590836605011047]
異方性ガウス混合モデルに基づくクラスタリング作業について検討する。
クラスタ中心における信号対雑音比の依存性を特徴づける。
論文 参考訳(メタデータ) (2021-01-14T00:31:52Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Local Graph Clustering with Network Lasso [90.66817876491052]
局所グラフクラスタリングのためのネットワークLasso法の統計的および計算的性質について検討する。
nLassoによって提供されるクラスタは、クラスタ境界とシードノードの間のネットワークフローを通じて、エレガントに特徴付けられる。
論文 参考訳(メタデータ) (2020-04-25T17:52:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。