論文の概要: Gradient Based Clustering
- arxiv url: http://arxiv.org/abs/2202.00720v1
- Date: Tue, 1 Feb 2022 19:31:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-03 13:49:38.276825
- Title: Gradient Based Clustering
- Title(参考訳): 勾配に基づくクラスタリング
- Authors: Aleksandar Armacki, Dragana Bajovic, Dusan Jakovetic, Soummya Kar
- Abstract要約: 本稿では,クラスタリングの品質を計測するコスト関数の勾配を用いて,距離に基づくクラスタリングの一般的な手法を提案する。
アプローチは反復的な2段階の手順(クラスタ割り当てとクラスタセンターのアップデートの代替)であり、幅広い機能に適用できる。
- 参考スコア(独自算出の注目度): 72.15857783681658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a general approach for distance based clustering, using the
gradient of the cost function that measures clustering quality with respect to
cluster assignments and cluster center positions. The approach is an iterative
two step procedure (alternating between cluster assignment and cluster center
updates) and is applicable to a wide range of functions, satisfying some mild
assumptions. The main advantage of the proposed approach is a simple and
computationally cheap update rule. Unlike previous methods that specialize to a
specific formulation of the clustering problem, our approach is applicable to a
wide range of costs, including non-Bregman clustering methods based on the
Huber loss. We analyze the convergence of the proposed algorithm, and show that
it converges to the set of appropriately defined fixed points, under arbitrary
center initialization. In the special case of Bregman cost functions, the
algorithm converges to the set of centroidal Voronoi partitions, which is
consistent with prior works. Numerical experiments on real data demonstrate the
effectiveness of the proposed method.
- Abstract(参考訳): 本稿では,クラスタ割り当てやクラスタ中心位置に対するクラスタリング品質を測定するコスト関数の勾配を用いて,距離に基づくクラスタリングの一般的な手法を提案する。
このアプローチは、反復的な2段階の手順(クラスタ割り当てとクラスタセンター更新の相互調整)であり、いくつかの穏やかな仮定を満たす幅広い機能に適用できる。
提案手法の主な利点は、シンプルで計算量的に安いアップデートルールである。
クラスタリング問題の特定の定式化に特化する従来の手法とは異なり,ハマーロスに基づく非ブレグマンクラスタリング手法を含む,幅広いコストに対して適用可能である。
提案アルゴリズムの収束を解析し、任意の中心初期化の下で適切に定義された固定点の集合に収束することを示す。
ブレグマンのコスト関数の特別な場合、アルゴリズムは、以前の研究と整合した中心的ボロノイ分割の集合に収束する。
実データを用いた数値実験により,提案手法の有効性が示された。
関連論文リスト
- Anchor-free Clustering based on Anchor Graph Factorization [17.218481911995365]
Anchor Graph Factorization(AFCAGF)に基づくAnchor-free Clusteringと呼ばれる新しい手法を提案する。
AFCAGFはアンカーグラフの学習において革新的であり、サンプル間のペア距離の計算のみを必要とする。
我々は,クラスタセンターとFKMのサンプル間のメンバシップ行列の概念を,複数のアンカーポイントとサンプルを含むアンカーグラフに進化させた。
論文 参考訳(メタデータ) (2024-02-24T02:16:42Z) - Deep Embedding Clustering Driven by Sample Stability [16.53706617383543]
サンプル安定性(DECS)により駆動されるディープ埋め込みクラスタリングアルゴリズムを提案する。
具体的には、まずオートエンコーダで初期特徴空間を構築し、次にサンプル安定性に制約されたクラスタ指向の埋め込み機能を学ぶ。
5つのデータセットに対する実験結果から,提案手法は最先端のクラスタリング手法と比較して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-01-29T09:19:49Z) - Robust and Automatic Data Clustering: Dirichlet Process meets
Median-of-Means [18.3248037914529]
本稿では,モデルに基づく手法とセントロイド方式の原理を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。
クラスタリング誤差の上限に関する統計的保証は,既存のクラスタリングアルゴリズムよりも提案手法の利点を示唆している。
論文 参考訳(メタデータ) (2023-11-26T19:01:15Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Strong Consistency for a Class of Adaptive Clustering Procedures [0.0]
このクラス内の全てのクラスタリング手順は、IIDサンプルの下で強く整合していることが示される。
適応的な環境では、我々の研究は、その種の第1の強い一貫性のある結果をもたらす。
論文 参考訳(メタデータ) (2022-02-27T18:56:41Z) - Weighted Sparse Subspace Representation: A Unified Framework for
Subspace Clustering, Constrained Clustering, and Active Learning [0.3553493344868413]
まず,近距離点の疎凸結合として各点を表現しようとするスペクトルに基づく新しい部分空間クラスタリングアルゴリズムを提案する。
次に、アルゴリズムを制約付きクラスタリングとアクティブな学習設定に拡張します。
このようなフレームワークを開発する動機は、通常、少量のラベル付きデータが事前に利用可能であるという事実や、いくつかのポイントをコストでラベル付けできるという事実に起因しています。
論文 参考訳(メタデータ) (2021-06-08T13:39:43Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。