論文の概要: Recovery Guarantees for Kernel-based Clustering under Non-parametric
Mixture Models
- arxiv url: http://arxiv.org/abs/2110.09476v1
- Date: Mon, 18 Oct 2021 17:23:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 14:34:10.322140
- Title: Recovery Guarantees for Kernel-based Clustering under Non-parametric
Mixture Models
- Title(参考訳): 非パラメトリック混合モデルによるカーネルクラスタリングの回復保証
- Authors: Leena Chennuru Vankadara, Sebastian Bordt, Ulrike von Luxburg,
Debarghya Ghoshdastidar
- Abstract要約: 非パラメトリック混合モデルに基づくカーネルベースのクラスタリングアルゴリズムの統計的性能について検討する。
我々は、カーネルベースのデータクラスタリングとカーネル密度ベースのクラスタリングの間に重要な等価性を確立する。
- 参考スコア(独自算出の注目度): 26.847612684502998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the ubiquity of kernel-based clustering, surprisingly few statistical
guarantees exist beyond settings that consider strong structural assumptions on
the data generation process. In this work, we take a step towards bridging this
gap by studying the statistical performance of kernel-based clustering
algorithms under non-parametric mixture models. We provide necessary and
sufficient separability conditions under which these algorithms can
consistently recover the underlying true clustering. Our analysis provides
guarantees for kernel clustering approaches without structural assumptions on
the form of the component distributions. Additionally, we establish a key
equivalence between kernel-based data-clustering and kernel density-based
clustering. This enables us to provide consistency guarantees for kernel-based
estimators of non-parametric mixture models. Along with theoretical
implications, this connection could have practical implications, including in
the systematic choice of the bandwidth of the Gaussian kernel in the context of
clustering.
- Abstract(参考訳): カーネルベースのクラスタリングはユビキタスだが、データ生成プロセスにおいて強い構造的前提を考える設定以外には、驚くほど少ない統計的な保証が存在する。
本研究では,非パラメトリック混合モデルにおけるカーネルベースのクラスタリングアルゴリズムの統計的性能を調べることにより,このギャップを埋めるための一歩を踏み出す。
これらのアルゴリズムが根底にある真のクラスタリングを継続的に回復できる必要十分かつ十分な分離性条件を提供する。
本分析は,カーネルクラスタリング手法がコンポーネント分布の形式に関する構造的仮定を伴わない保証を提供する。
さらに,カーネルベースのデータクラスタリングとカーネル密度ベースのクラスタリングとの間に重要な等価性を確立する。
これにより、非パラメトリック混合モデルのカーネルベース推定器の整合性を保証することができる。
この接続は理論的な意味合いとともに、クラスタリングの文脈でガウスカーネルの帯域幅を体系的に選択するなど、実用的な意味を持つ可能性がある。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。
まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。
第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文 参考訳(メタデータ) (2024-04-14T01:51:11Z) - Kernel Correlation-Dissimilarity for Multiple Kernel k-Means Clustering [21.685153346752124]
現在の手法は情報多様性を高め、相関性や相似性に基づいて複数のカーネル間の相互依存を利用して冗長性を低減する。
本稿では,カーネルの相関と相似性の両方を体系的に統合する新しい手法を提案する。
カーネル相関と相違点のコヒーレンスを強調することにより,非線形情報抽出のためのより客観的かつ透明な戦略を提供する。
論文 参考訳(メタデータ) (2024-03-06T04:24:43Z) - Robust and Automatic Data Clustering: Dirichlet Process meets
Median-of-Means [18.3248037914529]
本稿では,モデルに基づく手法とセントロイド方式の原理を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。
クラスタリング誤差の上限に関する統計的保証は,既存のクラスタリングアルゴリズムよりも提案手法の利点を示唆している。
論文 参考訳(メタデータ) (2023-11-26T19:01:15Z) - Local Sample-weighted Multiple Kernel Clustering with Consensus
Discriminative Graph [73.68184322526338]
マルチカーネルクラスタリング(MKC)は、ベースカーネルの集合から最適な情報融合を実現するためにコミットされる。
本稿では,新しい局所サンプル重み付きマルチカーネルクラスタリングモデルを提案する。
実験により, LSWMKCはより優れた局所多様体表現を有し, 既存のカーネルやグラフベースのクラスタリングアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2022-07-05T05:00:38Z) - Perfect Spectral Clustering with Discrete Covariates [68.8204255655161]
本稿では,大規模なスパースネットワークのクラスにおいて,高い確率で完全クラスタリングを実現するスペクトルアルゴリズムを提案する。
本手法は,スペクトルクラスタリングによる一貫した潜在構造回復を保証する最初の方法である。
論文 参考訳(メタデータ) (2022-05-17T01:41:06Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - The Impact of Isolation Kernel on Agglomerative Hierarchical Clustering
Algorithms [12.363083467305787]
AHC(Agglomerative Hierarchical Clustering)は、一般的なクラスタリング手法の1つである。
距離測定に基づく既存のAHC法では, 密度の異なる隣接クラスタの同定が困難である。
我々は,データ依存カーネル(距離や既存のカーネルではなく)を使用することによって,それに対応する効果的な手段が提供されることを示した。
論文 参考訳(メタデータ) (2020-10-12T06:18:38Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Real Elliptically Skewed Distributions and Their Application to Robust
Cluster Analysis [5.137336092866906]
本稿では,Really Skewed(RESK)分布と関連するクラスタリングアルゴリズムの新しいクラスを提案する。
非対称分散および重み付きデータクラスタは、様々な現実世界のアプリケーションで報告されている。
論文 参考訳(メタデータ) (2020-06-30T10:44:39Z) - Simple and Scalable Sparse k-means Clustering via Feature Ranking [14.839931533868176]
直感的で実装が簡単で,最先端のアルゴリズムと競合する,スパースk平均クラスタリングのための新しいフレームワークを提案する。
本手法は,属性のサブセットのクラスタリングや部分的に観測されたデータ設定など,タスク固有のアルゴリズムに容易に一般化できる。
論文 参考訳(メタデータ) (2020-02-20T02:41:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。