論文の概要: New bounds on the cohesion of complete-link and other linkage methods for agglomeration clustering
- arxiv url: http://arxiv.org/abs/2405.00937v1
- Date: Thu, 2 May 2024 01:39:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-03 18:14:01.357693
- Title: New bounds on the cohesion of complete-link and other linkage methods for agglomeration clustering
- Title(参考訳): 集合クラスタリングのための完全リンクおよびその他のリンク法の結合に関する新しい境界
- Authors: Sanjoy Dasgupta, Eduardo Laber,
- Abstract要約: 距離空間の完全リンクにより得られたクラスタリングの最大径に関する現在利用可能な境界を改善する。
我々の新しい境界の一つは、既存の境界とは対照的に、直径の近似の観点から、完全リンクと単一リンクを分離することができる。
- 参考スコア(独自算出の注目度): 10.409652277630133
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Linkage methods are among the most popular algorithms for hierarchical clustering. Despite their relevance the current knowledge regarding the quality of the clustering produced by these methods is limited. Here, we improve the currently available bounds on the maximum diameter of the clustering obtained by complete-link for metric spaces. One of our new bounds, in contrast to the existing ones, allows us to separate complete-link from single-link in terms of approximation for the diameter, which corroborates the common perception that the former is more suitable than the latter when the goal is producing compact clusters. We also show that our techniques can be employed to derive upper bounds on the cohesion of a class of linkage methods that includes the quite popular average-link.
- Abstract(参考訳): リンク手法は階層的クラスタリングにおいて最も一般的なアルゴリズムの一つである。
関連性にもかかわらず、これらの手法によって生成されたクラスタリングの品質に関する現在の知識は限られている。
ここでは、距離空間の完全リンクにより得られるクラスタリングの最大径に関する現在利用可能な境界を改善する。
我々の新しい境界の1つは、既存の境界とは対照的に、直径の近似の観点から、完全リンクを単一リンクから分離することができ、これは、ゴールがコンパクトクラスタを生成するときに、前者が後者よりも適切であるという共通の認識を裏付ける。
また,本手法は,非常に一般的な平均リンクを含む一連のリンク手法の凝集に関する上限を導出するためにも有効であることを示す。
関連論文リスト
- On the cohesion and separability of average-link for hierarchical agglomerative clustering [5.494111035517599]
平均リンクは階層的凝集クラスタリングを構築するための最も一般的で効果的な方法の1つとして広く認識されている。
本稿では,距離空間における平均リンクの性能について,分離性と凝集度を捉えるいくつかの自然な基準について検討する。
また, 実データを用いた実験結果から, 結合性および分離性の両方が重要な目標である場合, 平均リンクが他の関連手法よりも良い選択であることが示唆された。
論文 参考訳(メタデータ) (2024-11-07T19:31:00Z) - Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Constrained Clustering and Multiple Kernel Learning without Pairwise
Constraint Relaxation [15.232192645789485]
本稿では,データを協調的にクラスタリングし,利用可能なペアワイズ制約に従ってカーネルを学習する,制約付きクラスタリングアルゴリズムを提案する。
提案手法は,多種多様な公開データセットにおいて,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-03-23T17:07:53Z) - Gradient Based Clustering [72.15857783681658]
本稿では,クラスタリングの品質を計測するコスト関数の勾配を用いて,距離に基づくクラスタリングの一般的な手法を提案する。
アプローチは反復的な2段階の手順(クラスタ割り当てとクラスタセンターのアップデートの代替)であり、幅広い機能に適用できる。
論文 参考訳(メタデータ) (2022-02-01T19:31:15Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Hierarchical Correlation Clustering and Tree Preserving Embedding [3.821323038670061]
本稿では,よく知られた相関クラスタリングを拡張する階層的相関クラスタリング手法を提案する。
本稿では,このような階層的相関クラスタリングを用いた教師なし表現学習について検討する。
論文 参考訳(メタデータ) (2020-02-18T17:44:25Z) - Toward Generalized Clustering through an One-Dimensional Approach [0.8122270502556374]
クラスタ間の分離のパッチを検出するアプローチは、凝集クラスタリング、特に単一リンクに基づいて開発されている。
この手法のポテンシャルは、より密度の低い間隙で分離された高密度の2つの間隔で特徴付けられる1次元クラスタリングモデルと同様に、点のクラスタレス均一分布と正規分布の解析に関して説明される。
論文 参考訳(メタデータ) (2020-01-01T16:52:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。