論文の概要: Parameter Free Clustering with Cluster Catch Digraphs (Technical Report)
- arxiv url: http://arxiv.org/abs/1912.11926v1
- Date: Thu, 26 Dec 2019 20:30:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-10 07:59:19.824974
- Title: Parameter Free Clustering with Cluster Catch Digraphs (Technical Report)
- Title(参考訳): cluster catch digraphsを用いたパラメータフリークラスタリング(技術報告)
- Authors: Art\"ur Manukyan and Elvan Ceyhan
- Abstract要約: クラスタキャッチグラフ (CCD) は密度ベースの手法とグラフベースの手法のハイブリッドであるクラスタリング手法を考案するために用いられる。
CCDはクラスタの数を見積もっているため、クラスタリングのためにダイグラフをアピールしている。
我々は,CCDアルゴリズムのパラメータフリーバージョンであり,強度パラメータの仕様を必要としないアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose clustering algorithms based on a recently developed geometric
digraph family called cluster catch digraphs (CCDs). These digraphs are used to
devise clustering methods that are hybrids of density-based and graph-based
clustering methods. CCDs are appealing digraphs for clustering, since they
estimate the number of clusters; however, CCDs (and density-based methods in
general) require some information on a parameter representing the
\emph{intensity} of assumed clusters in the data set. We propose algorithms
that are parameter free versions of the CCD algorithm and does not require a
specification of the intensity parameter whose choice is often critical in
finding an optimal partitioning of the data set. We estimate the number of
convex clusters by borrowing a tool from spatial data analysis, namely Ripley's
$K$ function. We call our new digraphs utilizing the $K$ function as RK-CCDs.
We show that the minimum dominating sets of RK-CCDs estimate and distinguish
the clusters from noise clusters in a data set, and hence allow the estimation
of the correct number of clusters. Our robust clustering algorithms are
comprised of methods that estimate both the number of clusters and the
intensity parameter, making them completely parameter free. We conduct Monte
Carlo simulations and use real life data sets to compare RK-CCDs with some
commonly used density-based and prototype-based clustering methods.
- Abstract(参考訳): 本研究では,最近開発されたクラスタキャッチダイアグラム(ccds)に基づくクラスタリングアルゴリズムを提案する。
これらのグラフは密度ベースのクラスタリング法とグラフベースのクラスタリング法のハイブリッドであるクラスタリング法を考案するために使用される。
CCDはクラスタの数を推定するため、クラスタリングのダイグラフをアピールするが、CCD(および密度に基づく一般的な方法)はデータセット内の仮定されたクラスタの 'emph{intensity}' を表すパラメータに関するいくつかの情報を必要とする。
我々は, ccdアルゴリズムのパラメータフリーバージョンであるアルゴリズムを提案し, データセットの最適分割を求める際に, 選択が重要となるインテンシティパラメータの仕様を必要としない。
空間データ解析からツールを借りて凸クラスタの数を推定し,ripleyの$k$関数を推定した。
我々は、RK-CCDとして$K$関数を利用する新しいダイグラフを呼ぶ。
RK-CCDの最小支配集合は、データセット内のノイズクラスタからクラスタを推定し、区別することにより、正しいクラスタ数を推定できることを示す。
我々のロバストクラスタリングアルゴリズムはクラスタ数と強度パラメータの両方を推定する手法で構成されており、完全にパラメータフリーである。
我々はモンテカルロシミュレーションを行い、実生活データセットを用いてRK-CCDと一般的な密度ベースおよびプロトタイプベースのクラスタリング手法を比較した。
関連論文リスト
- Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - DECWA : Density-Based Clustering using Wasserstein Distance [1.4132765964347058]
空間密度と確率的アプローチに基づく新しいクラスタリングアルゴリズムを提案する。
提案手法は, 様々なデータセットにおいて, 最先端の密度に基づくクラスタリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-25T11:10:08Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - POCS-based Clustering Algorithm [0.0]
本稿では,POCSに基づくクラスタリングアルゴリズムと呼ばれる,POCS法に基づく新しいクラスタリング手法を提案する。
提案するクラスタリングアルゴリズムは,POCSの並列プロジェクション手法を利用して,特徴空間に適切なクラスタプロトタイプを求める。
提案するPOCSクラスタリングアルゴリズムの性能は, 各種合成データセットを用いた実験により検証した。
論文 参考訳(メタデータ) (2022-08-15T12:33:09Z) - Fast and explainable clustering based on sorting [0.0]
我々はCLASSIXと呼ばれる高速で説明可能なクラスタリング手法を提案する。
このアルゴリズムは2つのスカラーパラメータ、すなわちアグリゲーションのための距離パラメータと、最小クラスタサイズを制御する別のパラメータによって制御される。
実験により, CLASSIXは最先端クラスタリングアルゴリズムと競合することを示した。
論文 参考訳(メタデータ) (2022-02-03T08:24:21Z) - Swarm Intelligence for Self-Organized Clustering [6.85316573653194]
Databionic Swarm(DBS)と呼ばれるSwarmシステムが導入された。
スウォームインテリジェンス、自己組織化、出現の相互関係を利用して、DBSはクラスタリングのタスクにおけるグローバルな目的関数の最適化に対する代替アプローチとして機能する。
論文 参考訳(メタデータ) (2021-06-10T06:21:48Z) - Very Compact Clusters with Structural Regularization via Similarity and
Connectivity [3.779514860341336]
本稿では,汎用データセットのためのエンドツーエンドのディープクラスタリングアルゴリズムであるVery Compact Clusters (VCC)を提案する。
提案手法は,最先端のクラスタリング手法よりも優れたクラスタリング性能を実現する。
論文 参考訳(メタデータ) (2021-06-09T23:22:03Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。