論文の概要: Silhouette-Guided Instance-Weighted k-means
- arxiv url: http://arxiv.org/abs/2506.12878v1
- Date: Sun, 15 Jun 2025 15:09:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:47.012394
- Title: Silhouette-Guided Instance-Weighted k-means
- Title(参考訳): シルエットガイド型インスタンス重み付きk-means
- Authors: Aggelos Semoglou, Aristidis Likas, John Pavlopoulos,
- Abstract要約: K-シル(K-Sil)は、シルエットのスコアに基づいて点を重み付けするk-meansアルゴリズムの改良である。
境界線やノイズの多い領域を抑えながら、適切にクラスタ化されたインスタンスを優先順位付けする。
これらの結果から、K-Silは高品質でよく分離されたクラスタを必要とするアプリケーションの原則的な代替品として確立される。
- 参考スコア(独自算出の注目度): 2.56711111236449
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clustering is a fundamental unsupervised learning task with numerous applications across diverse fields. Popular algorithms such as k-means often struggle with outliers or imbalances, leading to distorted centroids and suboptimal partitions. We introduce K-Sil, a silhouette-guided refinement of the k-means algorithm that weights points based on their silhouette scores, prioritizing well-clustered instances while suppressing borderline or noisy regions. The algorithm emphasizes user-specified silhouette aggregation metrics: macro-, micro-averaged or a combination, through self-tuning weighting schemes, supported by appropriate sampling strategies and scalable approximations. These components ensure computational efficiency and adaptability to diverse dataset geometries. Theoretical guarantees establish centroid convergence, and empirical validation on synthetic and real-world datasets demonstrates statistically significant improvements in silhouette scores over k-means and two other instance-weighted k-means variants. These results establish K-Sil as a principled alternative for applications demanding high-quality, well-separated clusters.
- Abstract(参考訳): クラスタリングは、さまざまな分野にまたがる多数のアプリケーションによる基本的な教師なしの学習タスクである。
k平均のような一般的なアルゴリズムは、しばしば外れ値や不均衡に悩まされ、歪んだセントロイドや準最適分割に繋がる。
K-Silは、K-meansアルゴリズムを改良したもので、それらのシルエットスコアに基づいて点を重み付けし、境界線や雑音のある領域を抑えながら、よくクラスタ化されたインスタンスを優先順位付けする。
このアルゴリズムは、適切なサンプリング戦略とスケーラブルな近似によってサポートされている自己調整重み付けスキームを通じて、マクロ、マイクロ平均または組み合わせという、ユーザ指定のシルエット集約メトリクスを強調する。
これらのコンポーネントは、多様なデータセットのジオメトリに対する計算効率と適応性を保証する。
理論的な保証はセントロイド収束を確立し、合成および実世界のデータセットに対する実証的検証は、k平均と他の2つのインスタンス重み付きk平均の変種に対するシルエットスコアの統計的に有意な改善を示す。
これらの結果から、K-Silは高品質でよく分離されたクラスタを必要とするアプリケーションの原則的な代替品として確立される。
関連論文リスト
- K*-Means: A Parameter-free Clustering Algorithm [55.20132267309382]
k*-meansは、kや他のパラメータをセットする必要がない新しいクラスタリングアルゴリズムである。
最小記述長の原理を用いて、クラスタの分割とマージによって最適なクラスタ数k*を自動的に決定する。
k*-平均が収束することが保証されることを証明し、kが未知のシナリオにおいて既存のメソッドよりも著しく優れていることを実験的に証明する。
論文 参考訳(メタデータ) (2025-05-17T08:41:07Z) - Estimating the Optimal Number of Clusters in Categorical Data Clustering by Silhouette Coefficient [0.5939858158928473]
本稿では,分類データクラスタリングにおける最適kを推定するアルゴリズムk-SCCを提案する。
k-SCCの性能を比較するために, 合成データセットと実データセットの比較実験を行った。
論文 参考訳(メタデータ) (2025-01-26T14:29:11Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Adaptively Robust and Sparse K-means Clustering [5.535948428518607]
本稿では,標準的なK-meansアルゴリズムのこれらの実用的限界に対処するため,適応的に頑健でスパースなK-meansクラスタリング(ARSK)を提案する。
頑健性のために,各観測値に冗長な誤差成分を導入し,グループスパースペナルティを用いて追加パラメータをペナルティ化する。
高次元ノイズ変数の影響に対応するために、重みを取り入れ、重みベクトルの空間性を制御するペナルティを実装することにより、目的関数を変更する。
論文 参考訳(メタデータ) (2024-07-09T15:20:41Z) - Fuzzy K-Means Clustering without Cluster Centroids [21.256564324236333]
ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。