論文の概要: Stable and consistent density-based clustering via multiparameter
persistence
- arxiv url: http://arxiv.org/abs/2005.09048v3
- Date: Thu, 3 Aug 2023 08:10:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 17:50:57.791830
- Title: Stable and consistent density-based clustering via multiparameter
persistence
- Title(参考訳): 多パラメータ持続性による安定かつ一貫した密度クラスタリング
- Authors: Alexander Rolle, Luis Scoccola
- Abstract要約: トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
- 参考スコア(独自算出の注目度): 77.34726150561087
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the degree-Rips construction from topological data analysis,
which provides a density-sensitive, multiparameter hierarchical clustering
algorithm. We analyze its stability to perturbations of the input data using
the correspondence-interleaving distance, a metric for hierarchical clusterings
that we introduce. Taking certain one-parameter slices of degree-Rips recovers
well-known methods for density-based clustering, but we show that these methods
are unstable. However, we prove that degree-Rips, as a multiparameter object,
is stable, and we propose an alternative approach for taking slices of
degree-Rips, which yields a one-parameter hierarchical clustering algorithm
with better stability properties. We prove that this algorithm is consistent,
using the correspondence-interleaving distance. We provide an algorithm for
extracting a single clustering from one-parameter hierarchical clusterings,
which is stable with respect to the correspondence-interleaving distance. And,
we integrate these methods into a pipeline for density-based clustering, which
we call Persistable. Adapting tools from multiparameter persistent homology, we
propose visualization tools that guide the selection of all parameters of the
pipeline. We demonstrate Persistable on benchmark datasets, showing that it
identifies multi-scale cluster structure in data.
- Abstract(参考訳): 本研究では,密度に敏感なマルチパラメータ階層クラスタリングアルゴリズムを提供するトポロジカルデータ解析から,次数リップス構成を考える。
本稿では,階層クラスタリングの指標である対応インターリーブ距離を用いて,入力データの摂動に対する安定性を解析する。
等級の1パラメータスライスを取ると、密度に基づくクラスタリングでよく知られた手法が回復するが、これらの手法は不安定であることを示す。
しかし、多パラメータオブジェクトとして次数リップが安定であることを証明するとともに、より優れた安定性を持つ1パラメータ階層クラスタリングアルゴリズムである次数リップのスライスを取るための別のアプローチを提案する。
我々は,このアルゴリズムが一致していることを証明する。
本研究では,1パラメータ階層クラスタリングから単一クラスタリングを抽出するアルゴリズムを提案する。
そして、これらのメソッドを密度ベースのクラスタリングのためのパイプラインに統合します。
多パラメータの永続的ホモロジーからツールに適応し、パイプラインの全てのパラメータの選択をガイドする可視化ツールを提案する。
ベンチマークデータセット上で永続性を示し,マルチスケールなクラスタ構造を識別する。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Deep Embedding Clustering Driven by Sample Stability [16.53706617383543]
サンプル安定性(DECS)により駆動されるディープ埋め込みクラスタリングアルゴリズムを提案する。
具体的には、まずオートエンコーダで初期特徴空間を構築し、次にサンプル安定性に制約されたクラスタ指向の埋め込み機能を学ぶ。
5つのデータセットに対する実験結果から,提案手法は最先端のクラスタリング手法と比較して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-01-29T09:19:49Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Fast conformational clustering of extensive molecular dynamics
simulation data [19.444636864515726]
本稿では,長い軌道の高速なコンフォーメーションクラスタリングを実現するために,教師なしのデータ処理ワークフローを提案する。
我々は密度に基づく空間クラスタリングアルゴリズム(HDBSCAN)と2つの次元削減アルゴリズム(cc_analysisとEncodermap)を組み合わせる。
4つのテストシステムの助けを借りて、このクラスタリングワークフローの機能とパフォーマンスを説明します。
論文 参考訳(メタデータ) (2023-01-11T14:36:43Z) - Enhancing cluster analysis via topological manifold learning [0.3823356975862006]
クラスタ化前にデータセットのトポロジ構造を推定することで,クラスタ検出を大幅に向上させることができることを示す。
位相構造を推定するための多様体学習法UMAPと密度に基づくクラスタリング法DBSCANを組み合わせた。
論文 参考訳(メタデータ) (2022-07-01T15:53:39Z) - Perfect Spectral Clustering with Discrete Covariates [68.8204255655161]
本稿では,大規模なスパースネットワークのクラスにおいて,高い確率で完全クラスタリングを実現するスペクトルアルゴリズムを提案する。
本手法は,スペクトルクラスタリングによる一貫した潜在構造回復を保証する最初の方法である。
論文 参考訳(メタデータ) (2022-05-17T01:41:06Z) - Quantile-based fuzzy C-means clustering of multivariate time series:
Robust techniques [2.3226893628361682]
外れ値の存在に対するロバスト性は、いわゆるメートル法、ノイズ、トリミングアプローチを用いて達成される。
シミュレーション実験の結果,アルゴリズムは外部系列の存在に対処する上で極めて有効であることが示唆された。
論文 参考訳(メタデータ) (2021-09-22T20:26:12Z) - Fuzzy clustering algorithms with distance metric learning and entropy
regularization [0.0]
本稿では,ユークリッド,シティブロック,マハラノビス距離とエントロピー正規化に基づくファジィクラスタリングアルゴリズムを提案する。
合成および実データセットに関するいくつかの実験は、ノイズの多い画像テクスチャセグメンテーションへの応用を含む、これらの適応クラスタリング手法の有用性を実証している。
論文 参考訳(メタデータ) (2021-02-18T18:19:04Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。