論文の概要: Hierarchical Clustering: $O(1)$-Approximation for Well-Clustered Graphs
- arxiv url: http://arxiv.org/abs/2112.09055v1
- Date: Thu, 16 Dec 2021 17:52:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-17 17:00:29.350412
- Title: Hierarchical Clustering: $O(1)$-Approximation for Well-Clustered Graphs
- Title(参考訳): 階層クラスタリング:$O(1)$- Approximation for Well-Clustered Graphs
- Authors: Bogdan-Adrian Manghiuc and He Sun
- Abstract要約: 階層クラスタリングのための2時間近似アルゴリズムを提案する。
本研究の意義は,合成データセットと実世界のデータセットの両方における経験的分析によって実証された。
- 参考スコア(独自算出の注目度): 3.2901541059183432
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hierarchical clustering studies a recursive partition of a data set into
clusters of successively smaller size, and is a fundamental problem in data
analysis. In this work we study the cost function for hierarchical clustering
introduced by Dasgupta, and present two polynomial-time approximation
algorithms: Our first result is an $O(1)$-approximation algorithm for graphs of
high conductance. Our simple construction bypasses complicated recursive
routines of finding sparse cuts known in the literature. Our second and main
result is an $O(1)$-approximation algorithm for a wide family of graphs that
exhibit a well-defined structure of clusters. This result generalises the
previous state-of-the-art, which holds only for graphs generated from
stochastic models. The significance of our work is demonstrated by the
empirical analysis on both synthetic and real-world data sets, on which our
presented algorithm outperforms the previously proposed algorithm for graphs
with a well-defined cluster structure.
- Abstract(参考訳): 階層的クラスタリングは、データセットを連続的に小さいサイズのクラスタに再帰的分割する研究であり、データ分析における根本的な問題である。
本研究では, dasgupta が導入した階層的クラスタリングのコスト関数を研究し, 2つの多項式時間近似アルゴリズムを提案する。
私たちの単純な構造は、文献で知られているスパースカットを見つける複雑な再帰ルーチンをバイパスします。
第2および第2の結果は、クラスタの明確に定義された構造を示す幅広いグラフ群に対する$O(1)$-approximationアルゴリズムである。
この結果は、確率モデルから生成されるグラフに対してのみ保持される前の最先端を一般化する。
本研究の意義は,提案アルゴリズムが以前に提案したクラスタ構造を持つグラフのアルゴリズムよりも優れていた合成データセットと実世界のデータセットの実証分析によって実証された。
関連論文リスト
- Dynamic Spectral Clustering with Provable Approximation Guarantee [7.6676757797831225]
本論文は, クラスタ構造が緩やかな条件下では, 最終グラフ$G_T$のクラスタはスペクトルクラスタリングアルゴリズムの動的変種によってよく近似できることを示した。
合成と実世界の両方のデータセットに関する実験的研究により、我々の設計したアルゴリズムの実用性がさらに裏付けられる。
論文 参考訳(メタデータ) (2024-06-05T11:16:55Z) - A Differentially Private Clustering Algorithm for Well-Clustered Graphs [6.523602840064548]
このようなグラフに特化された効率的な(epsilon,$delta$)-DPアルゴリズムを提供する。
我々のアルゴリズムは、ほぼバランスの取れたクラスタに対して$k$のグラフを扱う。
論文 参考訳(メタデータ) (2024-03-21T11:57:16Z) - Fast Approximation of Similarity Graphs with Kernel Density Estimation [12.321755440062732]
我々は,データポイントのセットである$X$から類似性グラフを構築するための新しいアルゴリズムをmathbbRd$に提示する。
提案アルゴリズムはカーネル密度推定問題に基づいており,任意のカーネル関数に適用可能である。
論文 参考訳(メタデータ) (2023-10-21T00:32:47Z) - Latent Random Steps as Relaxations of Max-Cut, Min-Cut, and More [30.919536115917726]
クラスタリングと単純化を統一する非負行列分解に基づく確率モデルを提案する。
ハードクラスタリングをソフトクラスタリングに緩和することにより、ハードクラスタリングの潜在的な問題をトラクタブルクラスタに緩和する。
論文 参考訳(メタデータ) (2023-08-12T02:47:57Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - One-step Bipartite Graph Cut: A Normalized Formulation and Its
Application to Scalable Subspace Clustering [56.81492360414741]
両部グラフの1ステップ正規化カットを、特に線形時間複雑性で実施する方法を示す。
本稿では、まず、正規化制約付き一段階二分グラフカット基準を特徴付けるとともに、そのトレース問題に対する等価性を理論的に証明する。
このカット基準を、適応アンカー学習、二部グラフ学習、一段階正規化二部グラフ分割を同時にモデル化するスケーラブルなサブスペースクラスタリングアプローチに拡張する。
論文 参考訳(メタデータ) (2023-05-12T11:27:20Z) - Differentially-Private Hierarchical Clustering with Provable
Approximation Guarantees [79.59010418610625]
階層クラスタリングのための微分プライベート近似アルゴリズムについて検討する。
例えば、$epsilon$-DPアルゴリズムは入力データセットに対して$O(|V|2/epsilon)$-additiveエラーを示さなければならない。
本稿では,ブロックを正確に復元する1+o(1)$近似アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-31T19:14:30Z) - AnchorGAE: General Data Clustering via $O(n)$ Bipartite Graph
Convolution [79.44066256794187]
我々は、グラフ畳み込みネットワーク(GCN)を構築するために使用される生成グラフモデルを導入することにより、グラフに非グラフデータセットを変換する方法を示す。
アンカーによって構築された二部グラフは、データの背後にある高レベル情報を利用するために動的に更新される。
理論的には、単純な更新が退化につながることを証明し、それに従って特定の戦略が設計される。
論文 参考訳(メタデータ) (2021-11-12T07:08:13Z) - Effective and Efficient Graph Learning for Multi-view Clustering [173.8313827799077]
マルチビュークラスタリングのための効率的かつ効率的なグラフ学習モデルを提案する。
本手法はテンソルシャッテンp-ノルムの最小化により異なるビューのグラフ間のビュー類似性を利用する。
提案アルゴリズムは時間経済であり,安定した結果を得るとともに,データサイズによく対応している。
論文 参考訳(メタデータ) (2021-08-15T13:14:28Z) - Structured Graph Learning for Clustering and Semi-supervised
Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。
本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。
我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文 参考訳(メタデータ) (2020-08-31T08:41:20Z) - Data Structures & Algorithms for Exact Inference in Hierarchical
Clustering [41.24805506595378]
本稿では,新しいトレリスデータ構造に基づく階層クラスタリングにおける表現型推論のための動的プログラミングアルゴリズムを提案する。
我々のアルゴリズムは時間と空間に比例してN$要素のパワーセットをスケールし、これは(2N-3)! 可能な階層のそれぞれを明示的に考慮するよりも指数関数的に効率的である。
論文 参考訳(メタデータ) (2020-02-26T17:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。