論文の概要: Clustering Based on Graph of Density Topology
- arxiv url: http://arxiv.org/abs/2009.11612v1
- Date: Thu, 24 Sep 2020 11:40:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 04:14:56.960612
- Title: Clustering Based on Graph of Density Topology
- Title(参考訳): 密度トポロジーのグラフに基づくクラスタリング
- Authors: Zhangyang Gao, Haitao Lin, Stan. Z Li
- Abstract要約: 密度トポロジーグラフ (GDT) に基づく新しいクラスタリングアルゴリズムを提案する。
GDTは一般的なデータセットのほとんど全てでSOTAのパフォーマンスを実現し、O(nlogn)の低時間複雑さを持つ。
- 参考スコア(独自算出の注目度): 41.57592288113871
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data clustering with uneven distribution in high level noise is challenging.
Currently, HDBSCAN is considered as the SOTA algorithm for this problem. In
this paper, we propose a novel clustering algorithm based on what we call graph
of density topology (GDT). GDT jointly considers the local and global
structures of data samples: firstly forming local clusters based on a density
growing process with a strategy for properly noise handling as well as cluster
boundary detection; and then estimating a GDT from relationship between local
clusters in terms of a connectivity measure, givingglobal topological graph.
The connectivity, measuring similarity between neighboring local clusters, is
based on local clusters rather than individual points, ensuring its robustness
to even very large noise. Evaluation results on both toy and real-world
datasets show that GDT achieves the SOTA performance by far on almost all the
popular datasets, and has a low time complexity of O(nlogn). The code is
available at https://github.com/gaozhangyang/DGC.git.
- Abstract(参考訳): 高レベルノイズにおける不均一分布によるデータクラスタリングは困難である。
現在、HDBSCANはこの問題のSOTAアルゴリズムとされている。
本稿では,密度トポロジーグラフ(gdt)と呼ばれるものに基づくクラスタリングアルゴリズムを提案する。
gdtは、データサンプルの局所的および大域的な構造について、まずは、適切なノイズ処理とクラスタ境界検出の戦略を伴う密度成長プロセスに基づいてローカルクラスタを形成、次に、接続測度の観点からローカルクラスタ間の関係からgdtを推定し、グローバルトポロジカルグラフを与える。
近接するローカルクラスタ間の類似性を測定するコネクティビティは、個々のポイントではなくローカルクラスタに基づいており、非常に大きなノイズに対して堅牢性を確保している。
玩具と実世界の両方のデータセットにおける評価結果は、GDTが一般的なデータセットのほとんど全てでSOTAのパフォーマンスをはるかに達成し、O(nlogn)の低時間複雑さを持つことを示している。
コードはhttps://github.com/gaozhangyang/dgc.gitで入手できる。
関連論文リスト
- DenMune: Density peak based clustering using mutual nearest neighbors [0.0]
多くのクラスタリングアルゴリズムは、クラスタが任意の形状、様々な密度、あるいはデータクラスが互いに不均衡で近接している場合に失敗する。
この課題を満たすために、新しいクラスタリングアルゴリズムであるDenMuneが提示されている。
これは、Kがユーザから要求される唯一のパラメータである大きさKの互いに近い近傍を用いて、密集領域を特定することに基づいている。
論文 参考訳(メタデータ) (2023-09-23T16:18:00Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Dink-Net: Neural Clustering on Large Graphs [59.10189693120368]
ディープグラフクラスタリング法 (Dink-Net) は, 拡張と縮小という概念を用いて提案される。
ノードを識別することにより、拡張によって劣化しても、表現は自己教師された方法で学習される。
クラスタリング分布は、提案したクラスタ拡張損失とクラスタ縮小損失を最小化することにより最適化される。
ランナアップと比較して、Dink-Net 9.62%は1100万ノードと16億エッジを持つogbn-papers100MデータセットでNMIの改善を実現している。
論文 参考訳(メタデータ) (2023-05-28T15:33:24Z) - Graph Representation Learning via Contrasting Cluster Assignments [57.87743170674533]
GRCCAと呼ばれるクラスタ割り当てを対比して、教師なしグラフ表現モデルを提案する。
クラスタリングアルゴリズムとコントラスト学習を組み合わせることで、局所的およびグローバルな情報を合成的にうまく活用する動機付けがある。
GRCCAは、ほとんどのタスクにおいて強力な競争力を持っている。
論文 参考訳(メタデータ) (2021-12-15T07:28:58Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Git: Clustering Based on Graph of Intensity Topology [25.679620842010422]
我々は、新しいクラスタリングアルゴリズムGIT(textbfIntensity textbfTopologyのtextbfGraphに基づくクラスタリング)を提案する。
高速な局所クラスタ検出、堅牢なトポグラフの構築、エッジカットにより、GITは魅力的なARISE性能を示す。
論文 参考訳(メタデータ) (2021-10-04T09:29:43Z) - Learning Hierarchical Graph Neural Networks for Image Clustering [81.5841862489509]
本稿では,画像の集合を未知の個数にクラスタリングする方法を学ぶ階層型グラフニューラルネットワーク(GNN)モデルを提案する。
我々の階層的なGNNは、階層の各レベルで予測される連結コンポーネントをマージして、次のレベルで新しいグラフを形成するために、新しいアプローチを用いています。
論文 参考訳(メタデータ) (2021-07-03T01:28:42Z) - Swarm Intelligence for Self-Organized Clustering [6.85316573653194]
Databionic Swarm(DBS)と呼ばれるSwarmシステムが導入された。
スウォームインテリジェンス、自己組織化、出現の相互関係を利用して、DBSはクラスタリングのタスクにおけるグローバルな目的関数の最適化に対する代替アプローチとして機能する。
論文 参考訳(メタデータ) (2021-06-10T06:21:48Z) - Incorporating User's Preference into Attributed Graph Clustering [14.082520165369885]
局所クラスタに対して,グラフ一様性(GU)と属性一様性(AU)の2つの品質尺度を提案する。
LOCLUによって検出された局所クラスタは、関心領域に集中し、グラフ内の効率的な情報フローを提供し、指定された属性のサブ空間に一様データ分布を示す。
論文 参考訳(メタデータ) (2020-03-24T19:07:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。