論文の概要: VDPC: Variational Density Peak Clustering Algorithm
- arxiv url: http://arxiv.org/abs/2201.00641v1
- Date: Wed, 29 Dec 2021 12:50:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-09 12:42:33.030761
- Title: VDPC: Variational Density Peak Clustering Algorithm
- Title(参考訳): VDPC:変動密度ピーククラスタリングアルゴリズム
- Authors: Yizhang Wang, Di Wang, You Zhou, Xiaofeng Zhang, Chai Quek
- Abstract要約: 本稿では,変分密度のクラスタを識別するための変分密度ピーククラスタリング(VDPC)アルゴリズムを提案する。
VDPCは2つの古典的アルゴリズム(DPCとDBSCAN)と4つの最先端拡張DPCアルゴリズムより優れている。
- 参考スコア(独自算出の注目度): 16.20037014662979
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The widely applied density peak clustering (DPC) algorithm makes an intuitive
cluster formation assumption that cluster centers are often surrounded by data
points with lower local density and far away from other data points with higher
local density. However, this assumption suffers from one limitation that it is
often problematic when identifying clusters with lower density because they
might be easily merged into other clusters with higher density. As a result,
DPC may not be able to identify clusters with variational density. To address
this issue, we propose a variational density peak clustering (VDPC) algorithm,
which is designed to systematically and autonomously perform the clustering
task on datasets with various types of density distributions. Specifically, we
first propose a novel method to identify the representatives among all data
points and construct initial clusters based on the identified representatives
for further analysis of the clusters' property. Furthermore, we divide all data
points into different levels according to their local density and propose a
unified clustering framework by combining the advantages of both DPC and
DBSCAN. Thus, all the identified initial clusters spreading across different
density levels are systematically processed to form the final clusters. To
evaluate the effectiveness of the proposed VDPC algorithm, we conduct extensive
experiments using 20 datasets including eight synthetic, six real-world and six
image datasets. The experimental results show that VDPC outperforms two
classical algorithms (i.e., DPC and DBSCAN) and four state-of-the-art extended
DPC algorithms.
- Abstract(参考訳): 広く応用された密度ピーククラスタリング(DPC)アルゴリズムは、クラスタセンターが局所密度の低いデータポイントに囲まれ、局所密度の低い他のデータポイントから遠く離れているという直感的なクラスタ形成を仮定する。
しかし、この仮定は、密度の低いクラスターを高密度の他のクラスターに容易にマージできるため、しばしば問題となるという1つの制限に悩まされている。
結果として、DPCは変動密度のクラスタを特定できない可能性がある。
この問題に対処するために,様々な種類の密度分布を持つデータセット上で,クラスタリングタスクを系統的かつ自律的に実行するための変分密度ピーククラスタリング(VDPC)アルゴリズムを提案する。
具体的には,まず,すべてのデータポイント間の代表者を識別し,特定された代表者に基づいて初期クラスタを構築し,クラスタの特性のさらなる分析を行う新しい手法を提案する。
さらに,DPCとDBSCANの両方の利点を組み合わせることで,各データポイントを局所密度に応じて異なるレベルに分割し,統一クラスタリングフレームワークを提案する。
したがって、異なる密度レベルにまたがる識別された初期クラスターはすべて、最終クラスターを形成するために体系的に処理される。
提案アルゴリズムの有効性を評価するため、8つの合成、6つの実世界、6つの画像データセットを含む20のデータセットを用いて広範な実験を行った。
実験の結果、VDPCは2つの古典的アルゴリズム(DPCとDBSCAN)と4つの最先端拡張DPCアルゴリズムより優れていた。
関連論文リスト
- Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - SHADE: Deep Density-based Clustering [13.629470968274]
SHADEは密度接続性を損失関数に組み込む最初のディープクラスタリングアルゴリズムである。
ディープオートエンコーダの表現力で高次元および大規模データセットをサポートする。
これはクラスタリングの品質、特に非ガウスクラスタを含むデータにおいて、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2024-10-08T18:03:35Z) - DECWA : Density-Based Clustering using Wasserstein Distance [1.4132765964347058]
空間密度と確率的アプローチに基づく新しいクラスタリングアルゴリズムを提案する。
提案手法は, 様々なデータセットにおいて, 最先端の密度に基づくクラスタリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-25T11:10:08Z) - GFDC: A Granule Fusion Density-Based Clustering with Evidential
Reasoning [22.526274021556755]
密度に基づくクラスタリングアルゴリズムは任意の形状のクラスタを検出できるため、広く適用されている。
本稿では,GFDCを用いた粒界融合密度クラスタリングを提案する。
サンプルの局所密度と大域密度は、まずスパース度測定によって測定される。
次に、情報グラニュラーを高密度および低密度領域に生成し、大きな密度差を持つクラスタの処理を支援する。
論文 参考訳(メタデータ) (2023-05-20T06:27:31Z) - Differentially Private Federated Clustering over Non-IID Data [59.611244450530315]
クラスタリングクラスタ(FedC)問題は、巨大なクライアント上に分散されたラベルなしデータサンプルを、サーバのオーケストレーションの下で有限のクライアントに正確に分割することを目的としている。
本稿では,DP-Fedと呼ばれる差分プライバシー収束手法を用いた新しいFedCアルゴリズムを提案する。
提案するDP-Fedの様々な属性は、プライバシー保護の理論的解析、特に非識別的かつ独立に分散された(非i.d.)データの場合において得られる。
論文 参考訳(メタデータ) (2023-01-03T05:38:43Z) - An Improved Probability Propagation Algorithm for Density Peak
Clustering Based on Natural Nearest Neighborhood [0.0]
高速探索と密度ピーク(DPC)の探索によるクラスタリングは,有望なクラスタリング手法であることが証明されている。
本稿では,DPC-PPNNNに基づく密度ピーククラスタリングのための改良された確率伝搬アルゴリズムを提案する。
いくつかのデータセットの実験では、DPC-PPNNNはDPC、K-means、DBSCANを上回っている。
論文 参考訳(メタデータ) (2022-07-04T03:36:57Z) - DeepCluE: Enhanced Image Clustering via Multi-layer Ensembles in Deep
Neural Networks [53.88811980967342]
本稿では,Ensembles (DeepCluE) を用いたDeep Clusteringを提案する。
ディープニューラルネットワークにおける複数のレイヤのパワーを活用することで、ディープクラスタリングとアンサンブルクラスタリングのギャップを埋める。
6つの画像データセットの実験結果から、最先端のディープクラスタリングアプローチに対するDeepCluEの利点が確認されている。
論文 参考訳(メタデータ) (2022-06-01T09:51:38Z) - Density-Based Clustering with Kernel Diffusion [59.4179549482505]
単位$d$次元ユークリッド球のインジケータ関数に対応するナイーブ密度は、密度に基づくクラスタリングアルゴリズムで一般的に使用される。
局所分布特性と滑らかさの異なるデータに適応する新しいカーネル拡散密度関数を提案する。
論文 参考訳(メタデータ) (2021-10-11T09:00:33Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。