論文の概要: Absolute indices for determining compactness, separability and number of clusters
- arxiv url: http://arxiv.org/abs/2510.13065v1
- Date: Wed, 15 Oct 2025 01:14:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.46058
- Title: Absolute indices for determining compactness, separability and number of clusters
- Title(参考訳): クラスタのコンパクト性、分離性、および数を決定する絶対指標
- Authors: Adil M. Bagirov, Ramiz M. Aliguliyev, Nargiz Sultanova, Sona Taheri,
- Abstract要約: 本稿では,クラスタのコンパクト性と分離性の両方を決定するために,新しい絶対クラスター指標を提案する。
提案したコンパクト性と分離性指標を適用して,クラスタの真の数を同定する。
- 参考スコア(独自算出の注目度): 3.00988853836121
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Finding "true" clusters in a data set is a challenging problem. Clustering solutions obtained using different models and algorithms do not necessarily provide compact and well-separated clusters or the optimal number of clusters. Cluster validity indices are commonly applied to identify such clusters. Nevertheless, these indices are typically relative, and they are used to compare clustering algorithms or choose the parameters of a clustering algorithm. Moreover, the success of these indices depends on the underlying data structure. This paper introduces novel absolute cluster indices to determine both the compactness and separability of clusters. We define a compactness function for each cluster and a set of neighboring points for cluster pairs. This function is utilized to determine the compactness of each cluster and the whole cluster distribution. The set of neighboring points is used to define the margin between clusters and the overall distribution margin. The proposed compactness and separability indices are applied to identify the true number of clusters. Using a number of synthetic and real-world data sets, we demonstrate the performance of these new indices and compare them with other widely-used cluster validity indices.
- Abstract(参考訳): データセットで"真の"クラスタを見つけることは難しい問題です。
異なるモデルとアルゴリズムを用いて得られたクラスタリングソリューションは、必ずしもコンパクトで十分に分離されたクラスタや最適なクラスタ数を提供するとは限らない。
クラスタの妥当性指標は、そのようなクラスタを識別するために一般的に適用される。
しかしながら、これらの指標は典型的には相対的であり、クラスタリングアルゴリズムの比較やクラスタリングアルゴリズムのパラメータの選択に使用される。
さらに、これらの指標の成功は、基礎となるデータ構造に依存します。
本稿では,クラスタのコンパクト性と分離性の両方を決定するために,新しい絶対クラスター指標を提案する。
各クラスタに対するコンパクト度関数と,クラスタ対に対する近傍点の集合を定義する。
この関数を用いて各クラスタのコンパクトさとクラスタ全体の分布を決定する。
隣接する点の集合は、クラスタ間のマージンと全体の分布マージンを定義するために使用される。
提案したコンパクト性と分離性指標を適用して,クラスタの真の数を同定する。
複数の合成および実世界のデータセットを用いて、これらの新しい指標の性能を実証し、他の広く使われているクラスタの妥当性指標と比較する。
関連論文リスト
- K*-Means: A Parameter-free Clustering Algorithm [55.20132267309382]
k*-meansは、kや他のパラメータをセットする必要がない新しいクラスタリングアルゴリズムである。
最小記述長の原理を用いて、クラスタの分割とマージによって最適なクラスタ数k*を自動的に決定する。
k*-平均が収束することが保証されることを証明し、kが未知のシナリオにおいて既存のメソッドよりも著しく優れていることを実験的に証明する。
論文 参考訳(メタデータ) (2025-05-17T08:41:07Z) - Guaranteed Recovery of Unambiguous Clusters [7.011239860967789]
クラスタリングは、しばしば難しい問題である。なぜなら、それは、"正しい"クラスタリングがどうあるべきかに固有の曖昧さのためである。
本稿は,クラスタ内の2つの高密度領域が,K$clusteringの2つの真に異なるクラスタよりも,2つの異なるクラスタのように見えるほど分離可能な状況について定式化する。
論文 参考訳(メタデータ) (2025-01-22T18:51:25Z) - Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Revisiting Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [85.51611950757643]
IAC (Instance-Adaptive Clustering, インスタンス適応クラスタリング) を提案する。
IACは$ MathcalO(n, textpolylog(n) $の計算複雑性を維持しており、大規模問題に対してスケーラブルで実用的なものである。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - A Computational Theory and Semi-Supervised Algorithm for Clustering [0.0]
クラスタリングは異常のないデータのグループ化の獲得である。
クラスタリング手法のカーネルは知覚異常検出アルゴリズムである。
半教師付きクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-12T09:15:58Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Point-Set Kernel Clustering [11.093960688450602]
本稿では,オブジェクトとオブジェクトの集合との類似性を計算する,ポイントセットカーネルと呼ばれる新しい類似度尺度を提案する。
新たなクラスタリング手法は,大規模データセットを扱えるように,効率的かつ効率的であることを示す。
論文 参考訳(メタデータ) (2020-02-14T00:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。