論文の概要: Lumbermark: Resistant Clustering by Chopping Up Mutual Reachability Minimum Spanning Trees
- arxiv url: http://arxiv.org/abs/2604.07143v1
- Date: Wed, 08 Apr 2026 14:36:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.584584
- Title: Lumbermark: Resistant Clustering by Chopping Up Mutual Reachability Minimum Spanning Trees
- Title(参考訳): Lumbermark: 相互到達性を最小限に抑えることで,耐性クラスタリングを実現する
- Authors: Marek Gagolewski,
- Abstract要約: Lumbermarkは、さまざまなサイズ、密度、形状のクラスタを検出できる堅牢な分割クラスタリングアルゴリズムである。
このアルゴリズムは、ユーザが指定したサイズでパーティションを生成するHDBSCANに代わるものと見なすことができる。
新しいメソッドの高速で使いやすい実装は、PythonとR用のオープンソースの'lumbermark'パッケージで利用できる。
- 参考スコア(独自算出の注目度): 0.9983624159392207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Lumbermark, a robust divisive clustering algorithm capable of detecting clusters of varying sizes, densities, and shapes. Lumbermark iteratively chops off large limbs connected by protruding segments of a dataset's mutual reachability minimum spanning tree. The use of mutual reachability distances smoothens the data distribution and decreases the influence of low-density objects, such as noise points between clusters or outliers at their peripheries. The algorithm can be viewed as an alternative to HDBSCAN that produces partitions with user-specified sizes. A fast, easy-to-use implementation of the new method is available in the open-source 'lumbermark' package for Python and R. We show that Lumbermark performs well on benchmark data and hope it will prove useful to data scientists and practitioners across different fields.
- Abstract(参考訳): Lumbermarkは、様々なサイズ、密度、形状のクラスタを検出できる頑健な分割クラスタリングアルゴリズムである。
Lumbermarkは、データセットの相互到達性最小限の木のセグメントを突き刺すことによって、接続された大きな手足を反復的に切断する。
相互到達可能性距離の使用は、データの分散を円滑にし、クラスタ間のノイズポイントや周辺でのアウトリーチなどの低密度オブジェクトの影響を減少させる。
このアルゴリズムは、ユーザが指定したサイズでパーティションを生成するHDBSCANに代わるものと見なすことができる。
新しいメソッドの高速で使いやすい実装は、PythonとR向けのオープンソースの'lumbermark'パッケージで利用可能である。
関連論文リスト
- Persistent Multiscale Density-based Clustering [0.515435457943463]
PLSCANのための空間クラスタリング
PLSCANは、HDBSCAN*が安定した(リーフ)クラスタを生成する全ての最小クラスタサイズを効率的に識別する。
PLSCANとHDBSCAN*の比較を行った。
論文 参考訳(メタデータ) (2025-12-18T14:01:35Z) - Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。
我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文 参考訳(メタデータ) (2025-05-07T11:37:23Z) - Categorical Data Clustering via Value Order Estimated Distance Metric Learning [53.28598689867732]
本稿では,分類属性を直感的に表現する新しい順序距離計量学習手法を提案する。
新しい共同学習パラダイムが開発され、クラスタリングとオーダー距離メートル法学習の代替となる。
提案手法は分類および混合データセットのクラスタリング精度に優れる。
論文 参考訳(メタデータ) (2024-11-19T08:23:25Z) - Accelerating k-Means Clustering with Cover Trees [0.30693357740321775]
表木指数に基づく新しいk-meansアルゴリズムを提案し, オーバーヘッドが比較的低く, 性能も良好である。
木集約と境界に基づくフィルタリングの利点を組み合わせたハイブリッドアルゴリズムを得る。
論文 参考訳(メタデータ) (2024-10-19T14:02:42Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Clustering with minimum spanning trees: How good can it be? [0.6883078440438425]
低次元分割データクラスタリングタスクにおいて、最小分散木が意味のある範囲を定量化する。
我々は、既存の最先端のMSTベースの分割スキームをレビューし、研究し、拡張し、一般化する。
全体として、Genieと情報理論の手法は、MST以外のアルゴリズムよりも優れていることが多い。
論文 参考訳(メタデータ) (2023-03-10T03:18:03Z) - Index $t$-SNE: Tracking Dynamics of High-Dimensional Datasets with
Coherent Embeddings [1.7188280334580195]
本稿では,クラスタの位置を保存した新しいものを作成するために,埋め込みを再利用する手法を提案する。
提案アルゴリズムは,新しい項目を埋め込むために$t$-SNEと同じ複雑さを持つ。
論文 参考訳(メタデータ) (2021-09-22T06:45:37Z) - SMLSOM: The shrinking maximum likelihood self-organizing map [0.0]
本稿では,確率分布モデルフレームワークに基づいて,適切な数のクラスタを自動的に選択するグリージーアルゴリズムを提案する。
既存の手法と比較して,提案手法は計算効率が高く,クラスタ数を正確に選択できる。
論文 参考訳(メタデータ) (2021-04-28T18:50:36Z) - Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance
Segmentation [75.93960390191262]
我々は、オブジェクトカテゴリ間の関係に関する事前知識を利用して、きめ細かいクラスを粗い親クラスにクラスタリングする。
そこで本研究では,NMS再サンプリング法を提案する。
提案手法はフォレストR-CNNと呼ばれ,ほとんどのオブジェクト認識モデルに適用可能なプラグイン・アンド・プレイモジュールとして機能する。
論文 参考訳(メタデータ) (2020-08-13T03:52:37Z) - OSLNet: Deep Small-Sample Classification with an Orthogonal Softmax
Layer [77.90012156266324]
本稿では,ニューラルネットワークのサブスペースを見つけることを目的としている。
そこで本研究では,Orthogonal Softmax Layer (OSL) を提案する。
実験結果から,提案OSLは4つの小サンプルベンチマークデータセットとの比較に用いた手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-04-20T02:41:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。