論文の概要: AuToMATo: A Parameter-Free Persistence-Based Clustering Algorithm
- arxiv url: http://arxiv.org/abs/2408.06958v1
- Date: Tue, 13 Aug 2024 15:15:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-14 17:06:48.935296
- Title: AuToMATo: A Parameter-Free Persistence-Based Clustering Algorithm
- Title(参考訳): AuToMATo:パラメータフリーパーシステンスクラスタリングアルゴリズム
- Authors: Marius Huber, Sara Kalisnik, Patrick Schnider,
- Abstract要約: 永続的ホモロジーに基づく新しいパラメータフリークラスタリングアルゴリズムであるAuToMAToを提案する。
我々は,AuToMAToを,他の最先端クラスタリングアルゴリズムと比較した。
我々はPythonでAuToMAToのオープンソース実装を提供し、標準シキトラーンアーキテクチャと完全に互換性がある。
- 参考スコア(独自算出の注目度): 0.1474723404975345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present AuToMATo, a novel parameter-free clustering algorithm based on persistent homology. AuToMATo combines the existing ToMATo clustering algorithm with a bootstrapping procedure in order to separate significant peaks of an estimated density function from non-significant ones. We perform a thorough comparison of AuToMATo against many other state-of-the-art clustering algorithms. We find that not only that AuToMATo compares favorably against other parameter-free clustering algorithms, but in many instances also significantly outperforms even the best selection of parameters for other algorithms. AuToMATo is motivated by applications in topological data analysis, in particular the Mapper algorithm, where it is desirable to work with a parameter-free clustering algorithm. Indeed, we provide evidence that AuToMATo performs well when used with Mapper. Finally, we provide an open-source implementation of AuToMATo in Python that is fully compatible with the standardscikit-learn architecture.
- Abstract(参考訳): 永続的ホモロジーに基づく新しいパラメータフリークラスタリングアルゴリズムであるAuToMAToを提案する。
AuToMAToは既存のToMAToクラスタリングアルゴリズムとブートストラップ処理を組み合わせて、推定密度関数の有意なピークを重要でないものから分離する。
我々は,AuToMAToを,他の最先端クラスタリングアルゴリズムと比較した。
AuToMAToが他のパラメータフリークラスタリングアルゴリズムと好意的に比較するだけでなく、多くのケースでは、他のアルゴリズムで最適なパラメータの選択よりもはるかに優れています。
AuToMAToは、トポロジカルデータ解析、特にMapperアルゴリズムのアプリケーションによって動機付けられており、パラメータフリーのクラスタリングアルゴリズムで作業することが望ましい。
実際、Mapperで使用する場合、AuToMAToがうまく機能することを示す証拠を提供する。
最後に、PythonでAuToMAToのオープンソース実装を提供し、標準シキトラーンアーキテクチャと完全に互換性がある。
関連論文リスト
- A Modular Spatial Clustering Algorithm with Noise Specification [0.0]
細菌ファームアルゴリズムは、閉じた実験農場の細菌の成長にインスパイアされている。
他のクラスタリングアルゴリズムとは対照的に、我々のアルゴリズムはクラスタリング中に除外されるノイズの量を規定する機能も備えている。
論文 参考訳(メタデータ) (2023-09-18T18:05:06Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - An Exact Algorithm for Semi-supervised Minimum Sum-of-Squares Clustering [0.5801044612920815]
半教師付きMSSCのための分岐結合アルゴリズムを提案する。
背景知識はペアワイズ・マスタリンクと結びつかない制約として組み込まれている。
提案したグローバル最適化アルゴリズムは,実世界のインスタンスを最大800個のデータポイントまで効率的に解決する。
論文 参考訳(メタデータ) (2021-11-30T17:08:53Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - Applying Semi-Automated Hyperparameter Tuning for Clustering Algorithms [0.0]
本研究では,クラスタリング問題に対する半自動ハイパーパラメータチューニングのためのフレームワークを提案する。
グリッド検索を使用して一連のグラフを開発し、メトリクスを解釈しやすくし、より効率的なドメイン固有評価に使用できる。
予備的な結果は、内部メトリクスが、開発されたクラスタのセマンティックな品質をキャプチャできないことを示している。
論文 参考訳(メタデータ) (2021-08-25T05:48:06Z) - Fuzzy Clustering with Similarity Queries [56.96625809888241]
ファジィ(fuzzy, soft objective)は、よく知られた$k$-means問題の一般化である。
クエリを少なくすることで、問題の解決が容易になる。
論文 参考訳(メタデータ) (2021-06-04T02:32:26Z) - The Automatic Quasi-clique Merger algorithm (AQCM) [0.0]
Automatic Quasi-Clique Mergerアルゴリズムは、QCMという名前で発表された初期の研究から適応された新しいアルゴリズムです。
本稿では,準斜晶凝集アプローチの一般的な考え方を示し,aqcmアルゴリズムの数学的ステップの詳細を述べるとともに,新しい手法の背景にある動機について述べる。
論文 参考訳(メタデータ) (2021-03-06T20:01:59Z) - Certifying clusters from sum-of-norms clustering [13.747619681451875]
本稿では,近似解から正しいクラスタ割り当てを同定し,証明するクラスタリングテストを提案する。
提案手法では, クラスタ割り当てが, 十分に多くの繰り返しを経て, 原始二重経路追従アルゴリズムによって保証されることが保証されていることを示す。
論文 参考訳(メタデータ) (2020-06-19T20:26:26Z) - Computationally efficient sparse clustering [67.95910835079825]
我々はPCAに基づく新しいクラスタリングアルゴリズムの有限サンプル解析を行う。
ここでは,ミニマックス最適誤クラスタ化率を,体制$|theta infty$で達成することを示す。
論文 参考訳(メタデータ) (2020-05-21T17:51:30Z) - Model Selection in Contextual Stochastic Bandit Problems [51.94632035240787]
基本アルゴリズムを選択できるメタアルゴリズムを開発した。
基本アルゴリズムの1つが$O(sqrtT)$後悔している場合でも、一般的には$Omega(sqrtT)$後悔よりも良いものを得ることはできません。
論文 参考訳(メタデータ) (2020-03-03T18:46:34Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。