論文の概要: An Improved Probability Propagation Algorithm for Density Peak
Clustering Based on Natural Nearest Neighborhood
- arxiv url: http://arxiv.org/abs/2207.01178v1
- Date: Mon, 4 Jul 2022 03:36:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 04:36:07.494484
- Title: An Improved Probability Propagation Algorithm for Density Peak
Clustering Based on Natural Nearest Neighborhood
- Title(参考訳): 自然最寄り近傍に基づく密度ピーククラスタリングのための改良確率伝播アルゴリズム
- Authors: Wendi Zuo, Xinmin Hou
- Abstract要約: 高速探索と密度ピーク(DPC)の探索によるクラスタリングは,有望なクラスタリング手法であることが証明されている。
本稿では,DPC-PPNNNに基づく密度ピーククラスタリングのための改良された確率伝搬アルゴリズムを提案する。
いくつかのデータセットの実験では、DPC-PPNNNはDPC、K-means、DBSCANを上回っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clustering by fast search and find of density peaks (DPC) (Since, 2014) has
been proven to be a promising clustering approach that efficiently discovers
the centers of clusters by finding the density peaks. The accuracy of DPC
depends on the cutoff distance ($d_c$), the cluster number ($k$) and the
selection of the centers of clusters. Moreover, the final allocation strategy
is sensitive and has poor fault tolerance. The shortcomings above make the
algorithm sensitive to parameters and only applicable for some specific
datasets. To overcome the limitations of DPC, this paper presents an improved
probability propagation algorithm for density peak clustering based on the
natural nearest neighborhood (DPC-PPNNN). By introducing the idea of natural
nearest neighborhood and probability propagation, DPC-PPNNN realizes the
nonparametric clustering process and makes the algorithm applicable for more
complex datasets. In experiments on several datasets, DPC-PPNNN is shown to
outperform DPC, K-means and DBSCAN.
- Abstract(参考訳): 高速探索によるクラスタリングと密度ピーク(dpc)の発見(2014年以降)は、密度ピークを見つけることでクラスタの中心を効率的に発見する有望なクラスタリングアプローチであることが証明されている。
DPCの精度は、カットオフ距離(d_c$)、クラスタ番号(k$)、クラスタの中心の選択に依存する。
さらに、最終的な割り当て戦略は敏感であり、耐障害性に乏しい。
上記の欠点により、アルゴリズムはパラメータに敏感になり、特定のデータセットにのみ適用できる。
DPCの限界を克服するため,本論文では,DPC-PPNNNに基づく密度ピーククラスタリングのための改良された確率伝搬アルゴリズムを提案する。
DPC-PPNNNは、自然近接近傍と確率伝播の概念を導入し、非パラメトリッククラスタリングプロセスを実現し、より複雑なデータセットに適用する。
いくつかのデータセットの実験では、DPC-PPNNNはDPC、K-means、DBSCANより優れていた。
関連論文リスト
- Adaptive $k$-nearest neighbor classifier based on the local estimation of the shape operator [49.87315310656657]
我々は, 局所曲率をサンプルで探索し, 周辺面積を適応的に定義する適応型$k$-nearest(kK$-NN)アルゴリズムを提案する。
多くの実世界のデータセットから、新しい$kK$-NNアルゴリズムは、確立された$k$-NN法と比較してバランスの取れた精度が優れていることが示されている。
論文 参考訳(メタデータ) (2024-09-08T13:08:45Z) - Scalable Density-based Clustering with Random Projections [9.028773906859541]
本稿では,コサイン距離の高い高次元密度クラスタリングアルゴリズムであるsDBSCANを提案する。
実証的には、sDBSCANは、現実世界の百万点データセット上の他の多くのクラスタリングアルゴリズムよりもはるかに高速で精度が高い。
論文 参考訳(メタデータ) (2024-02-24T01:45:51Z) - DenMune: Density peak based clustering using mutual nearest neighbors [0.0]
多くのクラスタリングアルゴリズムは、クラスタが任意の形状、様々な密度、あるいはデータクラスが互いに不均衡で近接している場合に失敗する。
この課題を満たすために、新しいクラスタリングアルゴリズムであるDenMuneが提示されている。
これは、Kがユーザから要求される唯一のパラメータである大きさKの互いに近い近傍を用いて、密集領域を特定することに基づいている。
論文 参考訳(メタデータ) (2023-09-23T16:18:00Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - A density peaks clustering algorithm with sparse search and K-d tree [16.141611031128427]
この問題を解決するために,スパース探索とK-d木を用いた密度ピーククラスタリングアルゴリズムを開発した。
分散特性が異なるデータセット上で、他の5つの典型的なクラスタリングアルゴリズムと比較して実験を行う。
論文 参考訳(メタデータ) (2022-03-02T09:29:40Z) - Escaping Saddle Points with Bias-Variance Reduced Local Perturbed SGD
for Communication Efficient Nonconvex Distributed Learning [58.79085525115987]
ローカル手法は通信時間を短縮する有望なアプローチの1つである。
局所的データセットが局所的損失の滑らかさよりも小さい場合,通信の複雑さは非局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-12T15:12:17Z) - VDPC: Variational Density Peak Clustering Algorithm [16.20037014662979]
本稿では,変分密度のクラスタを識別するための変分密度ピーククラスタリング(VDPC)アルゴリズムを提案する。
VDPCは2つの古典的アルゴリズム(DPCとDBSCAN)と4つの最先端拡張DPCアルゴリズムより優れている。
論文 参考訳(メタデータ) (2021-12-29T12:50:09Z) - Density-Based Clustering with Kernel Diffusion [59.4179549482505]
単位$d$次元ユークリッド球のインジケータ関数に対応するナイーブ密度は、密度に基づくクラスタリングアルゴリズムで一般的に使用される。
局所分布特性と滑らかさの異なるデータに適応する新しいカーネル拡散密度関数を提案する。
論文 参考訳(メタデータ) (2021-10-11T09:00:33Z) - Fast Density Estimation for Density-based Clustering Methods [3.8972699157287702]
密度に基づくクラスタリングアルゴリズムは、パターン認識や機械学習におけるクラスタの発見に広く利用されている。
密度に基づくアルゴリズムのロバスト性は、隣人を見つけ、時間を要する各点の密度を計算することによって大きく支配される。
本稿では, 高速主成分分析による密度に基づくクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-23T13:59:42Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - Improving Generative Adversarial Networks with Local Coordinate Coding [150.24880482480455]
GAN(Generative Adversarial Network)は、事前定義された事前分布から現実的なデータを生成することに成功している。
実際には、意味情報はデータから学んだ潜在的な分布によって表現される。
ローカル座標符号化(LCC)を用いたLCCGANモデルを提案する。
論文 参考訳(メタデータ) (2020-07-28T09:17:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。