論文の概要: kFuse: A novel density based agglomerative clustering
- arxiv url: http://arxiv.org/abs/2505.05748v1
- Date: Fri, 09 May 2025 03:11:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-12 20:40:10.13546
- Title: kFuse: A novel density based agglomerative clustering
- Title(参考訳): kFuse: 新しい密度ベースの凝集クラスタリング
- Authors: Huan Yan, Junjie Hu,
- Abstract要約: 本稿では,kFuseと呼ばれる密度に基づく凝集クラスタリング手法を提案する。
kFuse は,(1) 自然近傍におけるサブクラスタ分割,(2) 隣接するサンプルと最短距離の計算によるサブクラスタ間の境界接続の決定,(3) 平均密度と分散の計算によるサブクラスタ間の密度類似性の評価,の4つの重要な構成要素から構成される。
合成と実世界の両方のデータセットの実験結果から、kFuseの有効性が検証された。
- 参考スコア(独自算出の注目度): 9.061140802902514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agglomerative clustering has emerged as a vital tool in data analysis due to its intuitive and flexible characteristics. However, existing agglomerative clustering methods often involve additional parameters for sub-cluster partitioning and inter-cluster similarity assessment. This necessitates different parameter settings across various datasets, which is undoubtedly challenging in the absence of prior knowledge. Moreover, existing agglomerative clustering techniques are constrained by the calculation method of connection distance, leading to unstable clustering results. To address these issues, this paper introduces a novel density-based agglomerative clustering method, termed kFuse. kFuse comprises four key components: (1) sub-cluster partitioning based on natural neighbors; (2) determination of boundary connectivity between sub-clusters through the computation of adjacent samples and shortest distances; (3) assessment of density similarity between sub-clusters via the calculation of mean density and variance; and (4) establishment of merging rules between sub-clusters based on boundary connectivity and density similarity. kFuse requires the specification of the number of clusters only at the final merging stage. Additionally, by comprehensively considering adjacent samples, distances, and densities among different sub-clusters, kFuse significantly enhances accuracy during the merging phase, thereby greatly improving its identification capability. Experimental results on both synthetic and real-world datasets validate the effectiveness of kFuse.
- Abstract(参考訳): 集約的クラスタリングは、直感的で柔軟な特徴から、データ分析において重要なツールとして現れています。
しかし、既存の集約クラスタリング手法では、サブクラスタパーティショニングやクラスタ間類似性評価のためのパラメータが追加されることが多い。
これは、様々なデータセットで異なるパラメータ設定を必要とする。
さらに, 既存の凝集クラスタリング技術は接続距離の計算法によって制約され, 不安定なクラスタリング結果をもたらす。
このような問題に対処するために,kFuseと呼ばれる新しい密度に基づく凝集クラスタリング手法を提案する。
kFuse は,(1) 自然近傍をベースとしたサブクラスタ分割,(2) 隣接するサンプルと最短距離の計算によるサブクラスタ間の境界接続の決定,(3) 平均密度と分散の計算によるサブクラスタ間の密度類似度の評価,(4) 境界接続と密度類似度に基づくサブクラスタ間のマージ規則の確立の4つのキーコンポーネントから構成される。
kFuseは最終マージ段階でのみクラスタの数を指定する必要がある。
さらに、異なるサブクラスタ間の隣接サンプル、距離、密度を包括的に考慮することにより、kFuseはマージフェーズの精度を大幅に向上し、識別能力を大幅に向上させる。
合成と実世界の両方のデータセットの実験結果から、kFuseの有効性が検証された。
関連論文リスト
- Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Clustering by Mining Density Distributions and Splitting Manifold Structure [2.3759432635713895]
近年,スペクトルクラスタリングの効率向上のためのトップダウン手法が提案されている。
本稿では,局所構造からマイクロクラスターを得る方法を提案する。
その後、最終的なスペクトルクラスタリングのために、マイクロクラスタ間の新しい類似度尺度が提案される。
論文 参考訳(メタデータ) (2024-08-20T02:22:59Z) - Linear time Evidence Accumulation Clustering with KMeans [0.0]
この研究は、平均的なリンククラスタリングの振る舞いを模倣するトリックを記述する。
分割の密度を効率よく計算する方法を見つけ、二次的な複雑さから線形的な複雑さへのコストを削減した。
k平均結果は、計算コストを低く保ちながら、NMIの観点からは、最先端の技術に匹敵する。
論文 参考訳(メタデータ) (2023-11-15T14:12:59Z) - DECWA : Density-Based Clustering using Wasserstein Distance [1.4132765964347058]
空間密度と確率的アプローチに基づく新しいクラスタリングアルゴリズムを提案する。
提案手法は, 様々なデータセットにおいて, 最先端の密度に基づくクラスタリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-25T11:10:08Z) - GFDC: A Granule Fusion Density-Based Clustering with Evidential
Reasoning [22.526274021556755]
密度に基づくクラスタリングアルゴリズムは任意の形状のクラスタを検出できるため、広く適用されている。
本稿では,GFDCを用いた粒界融合密度クラスタリングを提案する。
サンプルの局所密度と大域密度は、まずスパース度測定によって測定される。
次に、情報グラニュラーを高密度および低密度領域に生成し、大きな密度差を持つクラスタの処理を支援する。
論文 参考訳(メタデータ) (2023-05-20T06:27:31Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Perfect Spectral Clustering with Discrete Covariates [68.8204255655161]
本稿では,大規模なスパースネットワークのクラスにおいて,高い確率で完全クラスタリングを実現するスペクトルアルゴリズムを提案する。
本手法は,スペクトルクラスタリングによる一貫した潜在構造回復を保証する最初の方法である。
論文 参考訳(メタデータ) (2022-05-17T01:41:06Z) - Stable and consistent density-based clustering via multiparameter
persistence [77.34726150561087]
トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文 参考訳(メタデータ) (2020-05-18T19:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。