論文の概要: CoreSPECT: Enhancing Clustering Algorithms via an Interplay of Density and Geometry
- arxiv url: http://arxiv.org/abs/2507.08243v1
- Date: Fri, 11 Jul 2025 01:13:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-14 18:03:54.213659
- Title: CoreSPECT: Enhancing Clustering Algorithms via an Interplay of Density and Geometry
- Title(参考訳): CoreSPECT:密度と幾何学の相互作用によるクラスタリングアルゴリズムの強化
- Authors: Chandra Sekhar Mukherjee, Joonyoung Bae, Jiapeng Zhang,
- Abstract要約: 分布と幾何学の相互作用は繰り返し見られるが、しばしば見過ごされる。
我々のフレームワークは、K-MeansやGMMのような単純なアルゴリズムの性能を高める。
平均して、我々のフレームワークはK-MeansのARIを40%改善し、GMMを14%改善しています。
- 参考スコア(独自算出の注目度): 3.967854215226183
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Density and geometry have long served as two of the fundamental guiding principles in clustering algorithm design, with algorithm usually focusing either on the density structure of the data (e.g., HDBSCAN and Density Peak Clustering) or the complexity of underlying geometry (e.g., manifold clustering algorithms). In this paper, we identify and formalize a recurring but often overlooked interaction between distribution and geometry and leverage this insight to design our clustering enhancement framework CoreSPECT (Core Space Projection-based Enhancement of Clustering Techniques). Our framework boosts the performance of simple algorithms like K-Means and GMM by applying them to strategically selected regions, then extending the partial partition to a complete partition for the dataset using a novel neighborhood graph based multi-layer propagation procedure. We apply our framework on 15 datasets from three different domains and obtain consistent and substantial gain in clustering accuracy for both K-Means and GMM. On average, our framework improves the ARI of K-Means by 40% and of GMM by 14%, often surpassing the performance of both manifold-based and recent density-based clustering algorithms. We further support our framework with initial theoretical guarantees, ablation to demonstrate the usefulness of the individual steps and with evidence of robustness to noise.
- Abstract(参考訳): 密度と幾何学は、クラスタリングアルゴリズム設計の基本的な原則の2つとして長く使われてきたが、アルゴリズムは通常、データの密度構造(例えば、HDBSCANと密度ピーククラスタリング)、または基礎となる幾何学の複雑さ(例えば、多様体クラスタリングアルゴリズム)に焦点を当てている。
本稿では,クラスタリング拡張フレームワークCoreSPECT(Core Space Projection-based Enhancement of Clustering Techniques)の設計のために,分散と幾何の相互作用が繰り返し見過ごされるが,見過ごされがちな点を識別し,定式化する。
我々のフレームワークは,K-MeansやGMMといった単純なアルゴリズムを戦略的に選択した領域に適用し,その部分分割を新しい近傍グラフに基づく多層伝搬法を用いてデータセットの完全分割に拡張することで,性能を向上させる。
フレームワークを3つの異なるドメインから15のデータセットに適用し、K-MeansとGMMのクラスタリング精度の一貫性と実質的な向上を得る。
我々のフレームワークは平均して K-Means の ARI を 40% 改善し,GMM を 14% 改善する。
我々は,まず理論的な保証,個々のステップの有用性の実証,およびノイズに対する堅牢性の証明により,我々の枠組みをさらに支援する。
関連論文リスト
- Unimodal Strategies in Density-Based Clustering [15.581610184349731]
本研究では, クラスタ数とコア点近傍半径の関係について, 密度に基づくクラスタリング法に固有の重要な特性を明らかにする。
我々はこの特性を利用して、三進探索アルゴリズムに基づいて、半径の適切な値を求めるための新しい戦略を考案する。
我々は,高次元,大規模NLP,オーディオ,コンピュータビジョンのタスクにまたがる広範囲な応用を通して方法論を検証する。
論文 参考訳(メタデータ) (2025-06-26T18:25:14Z) - Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。
我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文 参考訳(メタデータ) (2025-05-07T11:37:23Z) - Hierarchical clustering with maximum density paths and mixture models [44.443538161979056]
t-NEBは確率的に基底化された階層的クラスタリング法である。
自然な高次元データに対して最先端のクラスタリング性能が得られる。
論文 参考訳(メタデータ) (2025-03-19T15:37:51Z) - Autoencoded UMAP-Enhanced Clustering for Unsupervised Learning [49.1574468325115]
本稿では,低次元空間にデータを非線形に埋め込み,次に従来のクラスタリングアルゴリズムを用いて非教師なし学習を行う手法を提案する。
この埋め込みはデータのクラスタビリティを促進し、オートエンコーダニューラルネットワークのエンコーダとUMAPアルゴリズムの出力の2つのマッピングで構成されている。
MNISTデータに適用した場合、AUECはクラスタリング精度において最先端技術よりも大幅に優れている。
論文 参考訳(メタデータ) (2025-01-13T22:30:38Z) - Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - A Clustering Method with Graph Maximum Decoding Information [6.11503045313947]
本稿では,CMDIと呼ばれるグラフベースモデルにおけるデコード情報の最大化のための新しいクラスタリング手法を提案する。
CMDIは2次元構造情報理論を、グラフ構造抽出とグラフ分割という2つのフェーズからなるクラスタリングプロセスに組み込んでいる。
3つの実世界のデータセットに対する実証的な評価は、CMDIが古典的ベースライン法より優れており、より優れた復号化情報比(DI-R)を示すことを示している。
これらの結果から,デコード情報の品質と計算効率を向上させるCMDIの有効性が示され,グラフベースのクラスタリング解析において有用なツールとして位置づけられた。
論文 参考訳(メタデータ) (2024-03-18T05:18:19Z) - A Modular Framework for Centrality and Clustering in Complex Networks [0.6423239719448168]
本稿では,集中度とクラスタリングという2つの重要なネットワーク解析手法について検討する。
クラスタリングには情報フローベースのモデルが採用されている。
我々のクラスタリングは、エッジウェイトとノードの度合いの異なる解釈と相互作用と同様に、エッジ指向性に対応する柔軟性を自然に継承する。
論文 参考訳(メタデータ) (2021-11-23T03:01:29Z) - Very Compact Clusters with Structural Regularization via Similarity and
Connectivity [3.779514860341336]
本稿では,汎用データセットのためのエンドツーエンドのディープクラスタリングアルゴリズムであるVery Compact Clusters (VCC)を提案する。
提案手法は,最先端のクラスタリング手法よりも優れたクラスタリング性能を実現する。
論文 参考訳(メタデータ) (2021-06-09T23:22:03Z) - Spatial-Spectral Clustering with Anchor Graph for Hyperspectral Image [88.60285937702304]
本稿では、HSIデータクラスタリングのための空間スペクトルクラスタリングとアンカーグラフ(SSCAG)という新しい非監視アプローチを提案する。
提案されたSSCAGは最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-04-24T08:09:27Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Learning to Cluster Faces via Confidence and Connectivity Estimation [136.5291151775236]
重複する部分グラフを多数必要とせず,完全に学習可能なクラスタリングフレームワークを提案する。
提案手法はクラスタリングの精度を大幅に向上させ,その上で訓練した認識モデルの性能を向上させるが,既存の教師付き手法に比べて桁違いに効率的である。
論文 参考訳(メタデータ) (2020-04-01T13:39:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。