論文の概要: AdaBox: Adaptive Density-Based Box Clustering with Parameter Generalization
- arxiv url: http://arxiv.org/abs/2603.13339v1
- Date: Fri, 06 Mar 2026 23:34:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.318617
- Title: AdaBox: Adaptive Density-Based Box Clustering with Parameter Generalization
- Title(参考訳): AdaBox:パラメータ一般化による適応密度ベースボックスクラスタリング
- Authors: Ahmed Elmahdi,
- Abstract要約: AdaBoxはグリッドベースの密度クラスタリングアルゴリズムで、多様なデータジオメトリ間の堅牢性を実現する。
5つの評価指標でDBSCANとHDBSCANを著しく上回る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Density-based clustering algorithms like DBSCAN and HDBSCAN are foundational tools for discovering arbitrarily shaped clusters, yet their practical utility is undermined by acute hyperparameter sensitivity -- parameters tuned on one dataset frequently fail to transfer to others, requiring expensive re-optimization for each deployment. We introduce AdaBox (Adaptive Density-Based Box Clustering), a grid-based density clustering algorithm designed for robustness across diverse data geometries. AdaBox features a six-parameter design where parameters capture cluster structure rather than pairwise point relationships. Four parameters are inherently scale-invariant, one self-corrects for sampling bias, and one is adjusted via a density scaling stage, enabling reliable parameter transfer across 30-200x scale factors. AdaBox processes data through five stages: adaptive grid construction, liberal seed initialization, iterative growth with graduation, statistical cluster merging, and Gaussian boundary refinement. Comprehensive evaluation across 111 datasets demonstrates three key findings: (1) AdaBox significantly outperforms DBSCAN and HDBSCAN across five evaluation metrics, achieving the best score on 78\% of datasets with p < 0.05; (2) AdaBox uniquely exhibits parameter generalization. Protocol A (direct transfer to 30-100x larger datasets) shows AdaBox maintains performance while baselines collapse. (3) Ablation studies confirm the necessity of all five architectural stages for maintaining robustness.
- Abstract(参考訳): DBSCANやHDBSCANといった密度ベースのクラスタリングアルゴリズムは、任意の形のクラスタを見つけるための基本的なツールだが、その実用性は、急性のハイパーパラメータ感度によって損なわれている。
AdaBox(Adaptive Density-Based Box Clustering)は、グリッドベースの密度クラスタリングアルゴリズムで、多様なデータジオメトリにまたがる堅牢性を実現する。
AdaBoxには6パラメータの設計があり、パラメータはペアの点関係ではなくクラスタ構造をキャプチャする。
4つのパラメータは本質的にスケール不変であり、1つはサンプリングバイアスの自己補正であり、1つは密度スケーリング段階によって調整され、30-200倍スケール因子間の信頼性のあるパラメータ転送が可能である。
AdaBoxは、アダプティブグリッドの構築、リベラルシードの初期化、卒業に伴う反復的な成長、統計クラスタのマージ、ガウス境界の改良の5段階を通じてデータを処理している。
1) AdaBoxは5つの評価指標でDBSCANとHDBSCANを著しく上回り、p < 0.05 で 78 % のデータセットで最高のスコアを得る。
Protocol A(30~100倍のデータセットへの直接転送)は、AdaBoxがパフォーマンスを維持し、ベースラインが崩壊していることを示している。
(3) 強靭性維持のための5つの段階すべての必要性を, アブレーション研究により確認した。
関連論文リスト
- Persistent Multiscale Density-based Clustering [0.515435457943463]
PLSCANのための空間クラスタリング
PLSCANは、HDBSCAN*が安定した(リーフ)クラスタを生成する全ての最小クラスタサイズを効率的に識別する。
PLSCANとHDBSCAN*の比較を行った。
論文 参考訳(メタデータ) (2025-12-18T14:01:35Z) - You Can Trust Your Clustering Model: A Parameter-free Self-Boosting Plug-in for Deep Clustering [73.48306836608124]
DCBoostはパラメータフリーのプラグインで、現在のディープクラスタリングモデルのグローバルな特徴構造を強化するように設計されている。
本手法は, クラスタリング性能を効果的に向上することを目的としている。
論文 参考訳(メタデータ) (2025-11-26T09:16:36Z) - Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。
我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文 参考訳(メタデータ) (2025-05-07T11:37:23Z) - Hierarchical clustering with maximum density paths and mixture models [44.443538161979056]
t-NEBは確率的に基底化された階層的クラスタリング法である。
自然な高次元データに対して最先端のクラスタリング性能が得られる。
論文 参考訳(メタデータ) (2025-03-19T15:37:51Z) - Automating DBSCAN via Deep Reinforcement Learning [73.82740568765279]
本稿では,DBSCANの自動パラメータ検索フレームワークであるDRL-DBSCANを提案する。
このフレームワークは、クラスタリング環境をマルコフ決定プロセスとして知覚することで、パラメータ探索方向を調整する過程をモデル化する。
このフレームワークはDBSCANクラスタリングの精度を最大で26%、25%改善している。
論文 参考訳(メタデータ) (2022-08-09T04:40:11Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z) - Stable and consistent density-based clustering via multiparameter persistence [49.1574468325115]
トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文 参考訳(メタデータ) (2020-05-18T19:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。