論文の概要: Chamfer-Linkage for Hierarchical Agglomerative Clustering
- arxiv url: http://arxiv.org/abs/2602.10444v1
- Date: Wed, 11 Feb 2026 02:36:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.398676
- Title: Chamfer-Linkage for Hierarchical Agglomerative Clustering
- Title(参考訳): 階層的クラスタリングのためのChamfer-Linkage
- Authors: Kishen N Gowda, Willem Fletcher, MohammadHossein Bateni, Laxman Dhulipala, D Ellis Hershkowitz, Rajesh Jayaram, Jakub Łącki,
- Abstract要約: 本稿では,チャンファー距離を用いてクラスタ間距離を測定する新しいリンク関数であるemphChamfer-linkageを提案する。
チャンファー・リンクは古典的リンクよりも常に高品質なクラスタリングをもたらす。
この結果は,古典的リンケージ関数の実践的なドロップイン代替として,チャンファーリンクを確立する。
- 参考スコア(独自算出の注目度): 9.30413560778001
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hierarchical Agglomerative Clustering (HAC) is a widely-used clustering method based on repeatedly merging the closest pair of clusters, where inter-cluster distances are determined by a linkage function. Unlike many clustering methods, HAC does not optimize a single explicit global objective; clustering quality is therefore primarily evaluated empirically, and the choice of linkage function plays a crucial role in practice. However, popular classical linkages, such as single-linkage, average-linkage and Ward's method show high variability across real-world datasets and do not consistently produce high-quality clusterings in practice. In this paper, we propose \emph{Chamfer-linkage}, a novel linkage function that measures the distance between clusters using the Chamfer distance, a popular notion of distance between point-clouds in machine learning and computer vision. We argue that Chamfer-linkage satisfies desirable concept representation properties that other popular measures struggle to satisfy. Theoretically, we show that Chamfer-linkage HAC can be implemented in $O(n^2)$ time, matching the efficiency of classical linkage functions. Experimentally, we find that Chamfer-linkage consistently yields higher-quality clusterings than classical linkages such as average-linkage and Ward's method across a diverse collection of datasets. Our results establish Chamfer-linkage as a practical drop-in replacement for classical linkage functions, broadening the toolkit for hierarchical clustering in both theory and practice.
- Abstract(参考訳): 階層的集約クラスタリング(Hierarchical Agglomerative Clustering, HAC)は、クラスタ間距離をリンク関数によって決定する、最も近いクラスタのペアを反復的にマージする、広く使われているクラスタリング手法である。
多くのクラスタリング手法とは異なり、HACは単一の明示的なグローバルな目的を最適化していない。
しかし、シングルリンク、平均リンク、ウォードの手法のような一般的な古典的リンクは、実世界のデータセット間で高いばらつきを示し、実際に常に高品質なクラスタリングを生成するわけではない。
本稿では,機械学習とコンピュータビジョンにおける点雲間距離の一般的な概念である,チャンファー距離を用いてクラスタ間距離を測定する新しいリンク関数である 'emph{Chamfer-linkage} を提案する。
我々は、Chamfer-linkageが他の一般的な測度が満たすのに苦労する望ましい概念表現特性を満たすことを論じる。
理論的には、Chamfer-linkage HACを$O(n^2)$ timeで実装でき、古典的リンケージ関数の効率と一致することを示す。
実験により、Chamfer-linkageは、平均リンクやWardの手法のような古典的なリンクよりも、多様なデータセットの集合において、常に高品質なクラスタリングをもたらすことがわかった。
この結果は、古典的連鎖関数の実践的なドロップイン置換としてシャンファーリンクを確立し、理論と実践の両方において階層的クラスタリングのツールキットを広げた。
関連論文リスト
- You Can Trust Your Clustering Model: A Parameter-free Self-Boosting Plug-in for Deep Clustering [73.48306836608124]
DCBoostはパラメータフリーのプラグインで、現在のディープクラスタリングモデルのグローバルな特徴構造を強化するように設計されている。
本手法は, クラスタリング性能を効果的に向上することを目的としている。
論文 参考訳(メタデータ) (2025-11-26T09:16:36Z) - Graph Probability Aggregation Clustering [5.377020739388736]
本稿では,グローバルクラスタリング対象関数と局所クラスタリング制約を統一するグラフベースのファジィクラスタリングアルゴリズムを提案する。
GPACフレームワーク全体は多制約最適化問題として定式化され、ラグランジアン法を用いて解くことができる。
合成,実世界,ディープラーニングのデータセットを用いて行った実験は,GPACがクラスタリング性能において既存の最先端手法を超えるだけでなく,計算効率も優れていることを示した。
論文 参考訳(メタデータ) (2025-02-27T09:11:32Z) - Anchor Learning with Potential Cluster Constraints for Multi-view Clustering [11.536710289572552]
Anchor-based multi-view clustering (MVC) は、その効率性から注目されている。
本稿では,マルチビュークラスタリング (ALPC) 法に対する潜在的クラスタ制約付きアンカーラーニング法を提案する。
論文 参考訳(メタデータ) (2024-12-21T07:43:05Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - New bounds on the cohesion of complete-link and other linkage methods for agglomeration clustering [10.409652277630133]
距離空間の完全リンクにより得られたクラスタリングの最大径に関する現在利用可能な境界を改善する。
我々の新しい境界の一つは、既存の境界とは対照的に、直径の近似の観点から、完全リンクと単一リンクを分離することができる。
論文 参考訳(メタデータ) (2024-05-02T01:39:30Z) - CCFC: Bridging Federated Clustering and Contrastive Learning [8.822947930471429]
本稿では,クラスタコントラスト・フェデレーション・クラスタリング(CCFC)という新しいフェデレーション・クラスタリング手法を提案する。
CCFCは、実用的な観点から、デバイス障害を扱う上で優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-12T15:26:44Z) - Spatiotemporal k-means [39.98633724527769]
マルチスケールクラスタを解析できるk-means (STk) と呼ばれる2つの時間クラスタリング手法を提案する。
我々は、STkMがより複雑な機械学習タスク、特にビデオにおける関心の検出と追跡の教師なし領域にどのように拡張できるかを示す。
論文 参考訳(メタデータ) (2022-11-10T04:40:31Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。