論文の概要: SDC-HSDD-NDSA: Structure Detecting Cluster by Hierarchical Secondary
Directed Differential with Normalized Density and Self-Adaption
- arxiv url: http://arxiv.org/abs/2307.00677v1
- Date: Sun, 2 Jul 2023 22:30:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 14:47:29.858460
- Title: SDC-HSDD-NDSA: Structure Detecting Cluster by Hierarchical Secondary
Directed Differential with Normalized Density and Self-Adaption
- Title(参考訳): SDC-HSDD-NDSA:正規化密度と自己適応を考慮した階層的二次微分による構造検出クラスタ
- Authors: Hao Shu
- Abstract要約: 本稿では,低密度領域で分離されていない高密度領域の構造を検出できる密度に基づくクラスタリング手法を提案する。
このアルゴリズムは二次指向微分、階層、正規化密度、および自己適応係数を用いる。
その結果, 構造検出の妥当性, 騒音に対する頑健性, および粒度の独立性を検証し, 従来よりも優れた性能を示すことができた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Density-based clustering could be the most popular clustering algorithm since
it can identify clusters of arbitrary shape as long as different (high-density)
clusters are separated by low-density regions. However, the requirement of the
separateness of clusters by low-density regions is not trivial since a
high-density region might have different structures which should be clustered
into different groups. Such a situation demonstrates the main flaw of all
previous density-based clustering algorithms we have known--structures in a
high-density cluster could not be detected. Therefore, this paper aims to
provide a density-based clustering scheme that not only has the ability
previous ones have but could also detect structures in a high-density region
not separated by low-density ones. The algorithm employs secondary directed
differential, hierarchy, normalized density, as well as the self-adaption
coefficient, and thus is called Structure Detecting Cluster by Hierarchical
Secondary Directed Differential with Normalized Density and Self-Adaption,
dubbed by SDC-HSDD-NDSA for short. To illustrate its effectiveness, we run the
algorithm in several data sets. The results verify its validity in structure
detection, robustness over noises, as well as independence of granularities,
and demonstrate that it could outperform previous ones. The Python code of the
paper could be found on https://github.com/Hao-B-Shu/SDC-HSDD-NDSA.
- Abstract(参考訳): 密度に基づくクラスタリングは、異なる(高密度)クラスタが低密度領域で分離される限り、任意の形状のクラスタを識別できるため、最も一般的なクラスタリングアルゴリズムである可能性がある。
しかし、低密度領域によるクラスタの分離要件は、高密度領域が異なるグループにクラスタ化されるべき異なる構造を持つため、簡単ではない。
このような状況は、密度の高いクラスタでは既知の構造が検出できない以前の密度ベースのクラスタリングアルゴリズムの最大の欠陥を示している。
そこで本稿では,前者では有する能力を持つだけでなく,低密度者では分離されない高密度領域の構造を検出できる密度ベースのクラスタリング方式を提案する。
このアルゴリズムは二次指向性差分、階層性、正規化密度、および自己適応係数を用いており、SDC-HSDD-NDSAによって略して呼ばれる正規化密度と自己適応を伴う階層的二次指向性差分による構造検出クラスタと呼ばれる。
その効果を説明するために、アルゴリズムを複数のデータセットで実行した。
その結果, 構造検出の妥当性, 騒音に対する頑健性, および粒度の独立性を検証し, 従来より優れていることを示した。
論文のPythonコードはhttps://github.com/Hao-B-Shu/SDC-HSDD-NDSAで確認できる。
関連論文リスト
- Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - SHADE: Deep Density-based Clustering [13.629470968274]
SHADEは密度接続性を損失関数に組み込む最初のディープクラスタリングアルゴリズムである。
ディープオートエンコーダの表現力で高次元および大規模データセットをサポートする。
これはクラスタリングの品質、特に非ガウスクラスタを含むデータにおいて、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2024-10-08T18:03:35Z) - FLASC: A Flare-Sensitive Clustering Algorithm [0.0]
本稿では,クラスタ内の分岐を検知してサブポピュレーションを同定するアルゴリズムFLASCを提案する。
アルゴリズムの2つの変種が提示され、ノイズの堅牢性に対する計算コストが取引される。
両変種は計算コストの観点からHDBSCAN*と類似してスケールし,安定した出力を提供することを示す。
論文 参考訳(メタデータ) (2023-11-27T14:55:16Z) - DECWA : Density-Based Clustering using Wasserstein Distance [1.4132765964347058]
空間密度と確率的アプローチに基づく新しいクラスタリングアルゴリズムを提案する。
提案手法は, 様々なデータセットにおいて, 最先端の密度に基づくクラスタリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-25T11:10:08Z) - DenMune: Density peak based clustering using mutual nearest neighbors [0.0]
多くのクラスタリングアルゴリズムは、クラスタが任意の形状、様々な密度、あるいはデータクラスが互いに不均衡で近接している場合に失敗する。
この課題を満たすために、新しいクラスタリングアルゴリズムであるDenMuneが提示されている。
これは、Kがユーザから要求される唯一のパラメータである大きさKの互いに近い近傍を用いて、密集領域を特定することに基づいている。
論文 参考訳(メタデータ) (2023-09-23T16:18:00Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - SSDBCODI: Semi-Supervised Density-Based Clustering with Outliers
Detection Integrated [1.8444322599555096]
クラスタリング分析は、機械学習における重要なタスクの1つだ。
クラスタリングクラスタリングのパフォーマンスが、異常値によって著しく損なわれる可能性があるため、アルゴリズムは、異常値検出のプロセスを組み込もうとする。
我々は,半教師付き検出素子であるSSDBCODIを提案する。
論文 参考訳(メタデータ) (2022-08-10T21:06:38Z) - Local Sample-weighted Multiple Kernel Clustering with Consensus
Discriminative Graph [73.68184322526338]
マルチカーネルクラスタリング(MKC)は、ベースカーネルの集合から最適な情報融合を実現するためにコミットされる。
本稿では,新しい局所サンプル重み付きマルチカーネルクラスタリングモデルを提案する。
実験により, LSWMKCはより優れた局所多様体表現を有し, 既存のカーネルやグラフベースのクラスタリングアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2022-07-05T05:00:38Z) - Density-Based Clustering with Kernel Diffusion [59.4179549482505]
単位$d$次元ユークリッド球のインジケータ関数に対応するナイーブ密度は、密度に基づくクラスタリングアルゴリズムで一般的に使用される。
局所分布特性と滑らかさの異なるデータに適応する新しいカーネル拡散密度関数を提案する。
論文 参考訳(メタデータ) (2021-10-11T09:00:33Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。