論文の概要: Cluster Catch Digraphs with the Nearest Neighbor Distance
- arxiv url: http://arxiv.org/abs/2501.06268v1
- Date: Thu, 09 Jan 2025 19:15:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:27:17.950100
- Title: Cluster Catch Digraphs with the Nearest Neighbor Distance
- Title(参考訳): 最近傍距離のクラスタキャッチグラフ
- Authors: Rui Shi, Nedret Billor, Elvan Ceyhan,
- Abstract要約: クラスタ・キャッシュ・ダイグラフ(CCD)に基づくクラスタリングの新しい手法を提案する。
新しい手法は空間ランダムネステストの新しい変種を用いてRK-CCDの限界に対処する。
我々は,モンテカルロ解析を総合的に行い,本手法の性能評価を行う。
- 参考スコア(独自算出の注目度): 1.6440434996206625
- License:
- Abstract: We introduce a new method for clustering based on Cluster Catch Digraphs (CCDs). The new method addresses the limitations of RK-CCDs by employing a new variant of spatial randomness test that employs the nearest neighbor distance (NND) instead of the Ripley's K function used by RK-CCDs. We conduct a comprehensive Monte Carlo analysis to assess the performance of our method, considering factors such as dimensionality, data set size, number of clusters, cluster volumes, and inter-cluster distance. Our method is particularly effective for high-dimensional data sets, comparable to or outperforming KS-CCDs and RK-CCDs that rely on a KS-type statistic or the Ripley's K function. We also evaluate our methods using real and complex data sets, comparing them to well-known clustering methods. Again, our methods exhibit competitive performance, producing high-quality clusters with desirable properties. Keywords: Graph-based clustering, Cluster catch digraphs, High-dimensional data, The nearest neighbor distance, Spatial randomness test
- Abstract(参考訳): 本稿では,クラスタ・キャッシュ・ダイグラフ(CCD)に基づくクラスタリング手法を提案する。
新しい手法は、RK-CCDが使用するリプリーのK関数の代わりに近接距離(NND)を利用する新しい空間ランダム性試験を用いて、RK-CCDの限界に対処する。
本研究では, クラスタ間距離, クラスタ数, クラスタ間距離などの因子を考慮したモンテカルロ解析を行い, 提案手法の性能評価を行う。
提案手法は,KS型統計関数やRpleyのK関数に依存するKS-CCDやRK-CCDに匹敵する高次元データセットに対して特に有効である。
また,本手法を実・複雑データセットを用いて評価し,よく知られたクラスタリング手法と比較した。
また,提案手法は競争性能を示し,望ましい特性を持つ高品質クラスタを生成する。
キーワード:グラフベースのクラスタリング、クラスタキャッチダイグラフ、高次元データ、近接距離、空間ランダムネステスト
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Outlier Detection with Cluster Catch Digraphs [1.6440434996206625]
本稿では,クラスタ・キャッシュ・ダイグラフ(CCD)に基づく異常検出アルゴリズムを新たに導入する。
そこで我々は,Uniformity-based CCD with Mutual Catch Graph (U-MCCD), The Uniformity- and Neighbor-based CCD with Mutual Catch Graph (UN-MCCD), and their shape-adaptive variants (SU-MCCD and SUN-MCCD)を提案する。
以上の結果から,これらのアルゴリズムは,外乱検出の精度と適応性を大幅に向上させることが示唆された。
論文 参考訳(メタデータ) (2024-09-17T23:08:53Z) - DECWA : Density-Based Clustering using Wasserstein Distance [1.4132765964347058]
空間密度と確率的アプローチに基づく新しいクラスタリングアルゴリズムを提案する。
提案手法は, 様々なデータセットにおいて, 最先端の密度に基づくクラスタリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-25T11:10:08Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Very Compact Clusters with Structural Regularization via Similarity and
Connectivity [3.779514860341336]
本稿では,汎用データセットのためのエンドツーエンドのディープクラスタリングアルゴリズムであるVery Compact Clusters (VCC)を提案する。
提案手法は,最先端のクラスタリング手法よりも優れたクラスタリング性能を実現する。
論文 参考訳(メタデータ) (2021-06-09T23:22:03Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z) - Parameter Free Clustering with Cluster Catch Digraphs (Technical Report) [0.0]
クラスタキャッチグラフ (CCD) は密度ベースの手法とグラフベースの手法のハイブリッドであるクラスタリング手法を考案するために用いられる。
CCDはクラスタの数を見積もっているため、クラスタリングのためにダイグラフをアピールしている。
我々は,CCDアルゴリズムのパラメータフリーバージョンであり,強度パラメータの仕様を必要としないアルゴリズムを提案する。
論文 参考訳(メタデータ) (2019-12-26T20:30:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。