論文の概要: Topology-Driven Clustering: Enhancing Performance with Betti Number Filtration
- arxiv url: http://arxiv.org/abs/2505.04346v1
- Date: Wed, 07 May 2025 11:46:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:36.061917
- Title: Topology-Driven Clustering: Enhancing Performance with Betti Number Filtration
- Title(参考訳): トポロジ駆動クラスタリング - ベティ数フィルタによるパフォーマンス向上
- Authors: Arghya Pratihar, Kushal Bose, Swagatam Das,
- Abstract要約: 絡み合った形状を含む複雑なデータセットのクラスタリングは、大きな課題となる。
トポロジカル構造からフレキシブルに不可欠な特徴を捉えるためにベッチ列の概念を導入する。
提案アルゴリズムは,データセットに含まれる複雑で絡み合った形状のクラスタリングに有効である。
- 参考スコア(独自算出の注目度): 14.904264782690639
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clustering aims to form groups of similar data points in an unsupervised regime. Yet, clustering complex datasets containing critically intertwined shapes poses significant challenges. The prevailing clustering algorithms widely depend on evaluating similarity measures based on Euclidean metrics. Exploring topological characteristics to perform clustering of complex datasets inevitably presents a better scope. The topological clustering algorithms predominantly perceive the point set through the lens of Simplicial complexes and Persistent homology. Despite these approaches, the existing topological clustering algorithms cannot somehow fully exploit topological structures and show inconsistent performances on some highly complicated datasets. This work aims to mitigate the limitations by identifying topologically similar neighbors through the Vietoris-Rips complex and Betti number filtration. In addition, we introduce the concept of the Betti sequences to capture flexibly essential features from the topological structures. Our proposed algorithm is adept at clustering complex, intertwined shapes contained in the datasets. We carried out experiments on several synthetic and real-world datasets. Our algorithm demonstrated commendable performances across the datasets compared to some of the well-known topology-based clustering algorithms.
- Abstract(参考訳): クラスタリングは、教師なしのシステムにおいて、類似したデータポイントのグループを形成することを目的としている。
しかし、重要に絡み合った形状を含む複雑なデータセットのクラスタリングは、大きな課題となる。
一般的なクラスタリングアルゴリズムはユークリッド測度に基づく類似度の評価に大きく依存している。
複雑なデータセットのクラスタリングを行うためのトポロジ特性の探索は、必然的に、よりよいスコープを提供する。
位相的クラスタリングアルゴリズムは、Simplicial Complex と Persistent homology のレンズを通して設定された点を主に知覚する。
これらのアプローチにもかかわらず、既存のトポロジ的クラスタリングアルゴリズムは、何らかの形でトポロジ的構造をフル活用し、非常に複雑なデータセット上で不整合性を示すことはできない。
この研究は、ビエトリス・リップス複体とベッチ数濾過を通して、位相的に類似した近傍を同定することで、制限を緩和することを目的としている。
さらに,位相構造からフレキシブルに不可欠な特徴を捉えるため,ベッチ列の概念を導入する。
提案アルゴリズムは,データセットに含まれる複雑で絡み合った形状のクラスタリングに有効である。
いくつかの合成および実世界のデータセットについて実験を行った。
提案アルゴリズムは,よく知られたトポロジに基づくクラスタリングアルゴリズムと比較して,データセット間の圧縮可能な性能を示した。
関連論文リスト
- Revisiting Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [69.15976031704687]
IAC (Instance-Adaptive Clustering, インスタンス適応クラスタリング) を提案する。
IACは$ MathcalO(n, textpolylog(n) $の計算複雑性を維持しており、大規模問題に対してスケーラブルで実用的なものである。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Topological Point Cloud Clustering [5.079602839359521]
トポロジカル・ポイント・クラウド・クラスタリング(TPCC)は、グローバル・トポロジカルな特徴への貢献に基づいて任意のポイント・クラウドにポイントをクラスタリングする新しい手法である。
我々は、合成データと実世界のデータの両方でTPCCを試験し、古典的なスペクトルクラスタリングと比較する。
論文 参考訳(メタデータ) (2023-03-29T14:15:38Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - Enhancing cluster analysis via topological manifold learning [0.3823356975862006]
クラスタ化前にデータセットのトポロジ構造を推定することで,クラスタ検出を大幅に向上させることができることを示す。
位相構造を推定するための多様体学習法UMAPと密度に基づくクラスタリング法DBSCANを組み合わせた。
論文 参考訳(メタデータ) (2022-07-01T15:53:39Z) - Natural Hierarchical Cluster Analysis by Nearest Neighbors with
Near-Linear Time Complexity [0.0]
そこで本研究では,クラスタの自然な階層化を実現する,近接クラスタリングアルゴリズムを提案する。
集約的および分割的階層的クラスタリングアルゴリズムとは対照的に,我々のアプローチはアルゴリズムの反復的な動作に依存しない。
論文 参考訳(メタデータ) (2022-03-15T16:03:42Z) - Fast and explainable clustering based on sorting [0.0]
我々はCLASSIXと呼ばれる高速で説明可能なクラスタリング手法を提案する。
このアルゴリズムは2つのスカラーパラメータ、すなわちアグリゲーションのための距離パラメータと、最小クラスタサイズを制御する別のパラメータによって制御される。
実験により, CLASSIXは最先端クラスタリングアルゴリズムと競合することを示した。
論文 参考訳(メタデータ) (2022-02-03T08:24:21Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Structured Graph Learning for Clustering and Semi-supervised
Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。
本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。
我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文 参考訳(メタデータ) (2020-08-31T08:41:20Z) - Stable and consistent density-based clustering via multiparameter
persistence [77.34726150561087]
トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文 参考訳(メタデータ) (2020-05-18T19:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。