論文の概要: ToMAToMP: Robust and Multi-Parameter Topological Clustering
- arxiv url: http://arxiv.org/abs/2605.14824v1
- Date: Thu, 14 May 2026 13:32:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.844897
- Title: ToMAToMP: Robust and Multi-Parameter Topological Clustering
- Title(参考訳): ToMAToMP:ロバスト・マルチパラメータ・トポロジカルクラスタリング
- Authors: Ludo Andrianirina, Mathieu Carrière,
- Abstract要約: ToMAToMPは,理論的な保証とともに複数の関数を同時に処理できる最初のトポロジ的クラスタリング手法である。
ToMAToをグラフチューニングとは無関係にし、外れ値に対して堅牢にするために使用できることを示す。
- 参考スコア(独自算出の注目度): 6.216428054339837
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Topological clustering, and its main algorithm ToMATo, is a clustering method from Topological Data Analysis (TDA) which has been applied successfully in several applications during the last few years. This is due to its high versatility, as clusters are detected from the persistent components in the sublevel sets of any user-defined function (gene expression, pixel values, etc), and efficiency, as topological clustering enjoys robustness guarantees. However, ToMATo is also limited in several ways. First, a graph on the data points needs to be provided as a hyper-parameter of the method (whose fine-tuning is left to the user). Second, ToMATo is known to be very sensitive to outlier values in the function range. Finally, and most importantly, ToMATo can only handle one function at a time, whereas it is critical to use several functions in various applications. In this article, we introduce ToMAToMP: the first topological clustering method able to handle several functions at the same time with theoretical guarantees. More specifically, we leverage a recent tool from multi-parameter persistent homology, called MMA decomposition, to design our clustering algorithm, and prove that it enjoys robustness properties. As corollaries, we show that it can be used to make ToMATo independent of graph tuning, and robust to outliers. Finally, we provide a set of numerical experiments showcasing the efficiency and quality of the clusterings produced by ToMAToMP, by showing strong improvement over non-topological and topological baselines for various datasets.
- Abstract(参考訳): トポロジカルクラスタリングとそのアルゴリズムであるToMAToは、トポロジカルデータ解析(TDA)のクラスタリング手法であり、過去数年間、いくつかのアプリケーションでうまく適用されてきた。
これは、任意のユーザ定義関数(遺伝子発現、ピクセル値など)のサブレベルセットの永続的なコンポーネントからクラスタが検出され、トポロジ的クラスタリングが堅牢性を保証するため、効率が向上するためである。
しかし、ToMATOはいくつかの点で制限されている。
まず、データポイント上のグラフをメソッドのハイパーパラメータとして提供する必要があります(微調整はユーザーに委ねられます)。
第二に、ToMAToは関数範囲の外れ値に非常に敏感であることが知られている。
最後に、そして最も重要なことは、ToMAToは一度に1つの関数しか扱えないことだ。
本稿では,複数の関数を同時に扱える最初のトポロジ的クラスタリング手法であるToMAToMPを紹介する。
より具体的には、マルチパラメータの永続的ホモロジーからMMA分解と呼ばれる最近のツールを活用し、クラスタリングアルゴリズムを設計し、堅牢性を享受していることを証明する。
結論として,ToMAToをグラフチューニングとは無関係にし,外れ値に頑健にすることができることを示す。
最後に,ToMAToMPが生成するクラスタリングの効率と品質を示す数値実験を行い,各データセットの非トポロジ的およびトポロジ的ベースラインに対する強い改善を示す。
関連論文リスト
- MCbiF: Measuring Topological Autocorrelation in Multiscale Clusterings via 2-Parameter Persistent Homology [1.5813217907813781]
マルチスケールクラスタリング・ビファイリング (MCbiF) は,クラスタの交叉パターンを符号化する抽象的な単体錯体のフィルタとして定義する。
MCbiFの永続ホモロジー(MPH)は有限表現かつブロック分解可能な加群となることを示す。
我々は実験を通じて、下流機械学習タスクのトポロジ的特徴マップとしてMCbiF Hilbert関数の使用を実証した。
論文 参考訳(メタデータ) (2025-10-16T14:11:12Z) - Hyperoctant Search Clustering: A Method for Clustering Data in High-Dimensional Hyperspheres [0.0]
座標の符号(ハイパーロクタント)によって定義される空間の領域に適用される位相的アプローチに基づく新しいクラスタリング法を提案する。
密度基準によれば、この方法はグラフの分割に基づいてデータポイントのクラスタを構築する。
テキストマイニングにおいて重要な課題である話題検出の応用を選択する。
論文 参考訳(メタデータ) (2025-03-10T23:41:44Z) - Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。
本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。
両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文 参考訳(メタデータ) (2024-06-12T08:30:16Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Superclustering by finding statistically significant separable groups of
optimal gaussian clusters [0.0]
本稿では,BIC基準の観点から,最適なデータセットをグループ化することで,データセットをクラスタリングするアルゴリズムを提案する。
このアルゴリズムの重要な利点は、既に訓練済みのクラスタに基づいて、新しいデータの正しいスーパークラスタを予測する能力である。
論文 参考訳(メタデータ) (2023-09-05T23:49:46Z) - Detection of Anomalies in Multivariate Time Series Using Ensemble
Techniques [3.2422067155309806]
最終的な決定に向けて,複数の基本モデルを組み合わせたアンサンブル手法を提案する。
また,ロジスティック回帰器を用いて基本モデルの出力を結合する半教師付き手法を提案する。
異常検出精度の点での性能改善は、教師なしモデルでは2%、半教師なしモデルでは少なくとも10%に達する。
論文 参考訳(メタデータ) (2023-08-06T17:51:22Z) - Revisiting Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [85.51611950757643]
IAC (Instance-Adaptive Clustering, インスタンス適応クラスタリング) を提案する。
IACは$ MathcalO(n, textpolylog(n) $の計算複雑性を維持しており、大規模問題に対してスケーラブルで実用的なものである。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Topological Quality of Subsets via Persistence Matching Diagrams [0.196629787330046]
我々は、トポロジカルデータ解析技術を用いて、そのデータセットに関するサブセットの品質を測定する。
特に,本手法では,選択したサブセットが教師付き学習モデルの貧弱な性能をもたらす可能性がある理由を説明することができる。
論文 参考訳(メタデータ) (2023-06-04T17:08:41Z) - Spatiotemporal k-means [39.98633724527769]
マルチスケールクラスタを解析できるk-means (STk) と呼ばれる2つの時間クラスタリング手法を提案する。
我々は、STkMがより複雑な機械学習タスク、特にビデオにおける関心の検出と追跡の教師なし領域にどのように拡張できるかを示す。
論文 参考訳(メタデータ) (2022-11-10T04:40:31Z) - Stable and consistent density-based clustering via multiparameter persistence [49.1574468325115]
トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文 参考訳(メタデータ) (2020-05-18T19:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。