論文の概要: CavMerge: Merging K-means Based on Local Log-Concavity
- arxiv url: http://arxiv.org/abs/2604.04302v1
- Date: Sun, 05 Apr 2026 22:47:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.036034
- Title: CavMerge: Merging K-means Based on Local Log-Concavity
- Title(参考訳): CavMerge: ローカルログコンカビューティに基づいたK平均のマージ
- Authors: Zhili Qiao, Wangqian Ju, Peng Liu,
- Abstract要約: K平均クラスタリングは、非線形分離データに適用した場合、最適以下の性能を示すことが知られている。
本稿では,新しいK平均マージアルゴリズムであるemphCavMergeについて述べる。
- 参考スコア(独自算出の注目度): 2.579311291240392
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: K-means clustering, a classic and widely-used clustering technique, is known to exhibit suboptimal performance when applied to non-linearly separable data. Numerous adjustments and modifications have been proposed to address this issue, including methods that merge K-means results from a relatively large K to obtain a final cluster assignment. However, existing methods of this nature often encounter computational inefficiencies and suffer from hyperparameter tuning. Here we present \emph{CavMerge}, a novel K-means merging algorithm that is intuitive, free of parameter tuning, and computationally efficient. Operating under minimal local distributional assumptions, our algorithm demonstrates strong consistency and rapid convergence guarantees. Empirical studies on various simulated and real datasets demonstrate that our method yields more reliable clusters in comparison to current state-of-the-art algorithms.
- Abstract(参考訳): 古典的で広く使われているクラスタリング手法であるK平均クラスタリングは、非線形分離データに適用した場合、最適以下の性能を示すことが知られている。
この問題に対処するために、K平均値を比較的大きなKからマージして最終的なクラスタ割り当てを得る方法を含む、多くの調整と修正が提案されている。
しかし、この性質の既存の手法はしばしば計算の非効率さに遭遇し、ハイパーパラメータチューニングに悩まされる。
ここでは、直感的でパラメータチューニングが不要で、計算効率が良い新しいK平均マージアルゴリズムである \emph{CavMerge} を提示する。
最小限の局所分布仮定の下では,アルゴリズムは強い一貫性と高速収束保証を示す。
種々のシミュレーションおよび実データに対する実証研究により,本手法は現在の最先端アルゴリズムと比較して,より信頼性の高いクラスタを生成することが示された。
関連論文リスト
- CAS Condensed and Accelerated Silhouette: An Efficient Method for Determining the Optimal K in K-Means Clustering [0.0]
本稿では,クラスタリングにおけるkの最適値を選択するための戦略を提案する。
複雑なデータ環境におけるクラスタリング精度と計算効率のバランスを達成することに焦点を当てている。
提案手法は,高次元データセット上での実行時間を最大99%高速化する。
論文 参考訳(メタデータ) (2025-07-11T05:03:16Z) - Silhouette-Guided Instance-Weighted k-means [2.56711111236449]
K-シル(K-Sil)は、シルエットのスコアに基づいて点を重み付けするk-meansアルゴリズムの改良である。
境界線やノイズの多い領域を抑えながら、適切にクラスタ化されたインスタンスを優先順位付けする。
これらの結果から、K-Silは高品質でよく分離されたクラスタを必要とするアプリケーションの原則的な代替品として確立される。
論文 参考訳(メタデータ) (2025-06-15T15:09:05Z) - K*-Means: A Parameter-free Clustering Algorithm [55.20132267309382]
k*-meansは、kや他のパラメータをセットする必要がない新しいクラスタリングアルゴリズムである。
最小記述長の原理を用いて、クラスタの分割とマージによって最適なクラスタ数k*を自動的に決定する。
k*-平均が収束することが保証されることを証明し、kが未知のシナリオにおいて既存のメソッドよりも著しく優れていることを実験的に証明する。
論文 参考訳(メタデータ) (2025-05-17T08:41:07Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Adaptively Robust and Sparse K-means Clustering [5.535948428518607]
本稿では,標準的なK-meansアルゴリズムのこれらの実用的限界に対処するため,適応的に頑健でスパースなK-meansクラスタリング(ARSK)を提案する。
頑健性のために,各観測値に冗長な誤差成分を導入し,グループスパースペナルティを用いて追加パラメータをペナルティ化する。
高次元ノイズ変数の影響に対応するために、重みを取り入れ、重みベクトルの空間性を制御するペナルティを実装することにより、目的関数を変更する。
論文 参考訳(メタデータ) (2024-07-09T15:20:41Z) - Fuzzy K-Means Clustering without Cluster Centroids [21.256564324236333]
ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - Linear time Evidence Accumulation Clustering with KMeans [0.0]
この研究は、平均的なリンククラスタリングの振る舞いを模倣するトリックを記述する。
分割の密度を効率よく計算する方法を見つけ、二次的な複雑さから線形的な複雑さへのコストを削減した。
k平均結果は、計算コストを低く保ちながら、NMIの観点からは、最先端の技術に匹敵する。
論文 参考訳(メタデータ) (2023-11-15T14:12:59Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。