論文の概要: The ParClusterers Benchmark Suite (PCBS): A Fine-Grained Analysis of Scalable Graph Clustering
- arxiv url: http://arxiv.org/abs/2411.10290v1
- Date: Fri, 15 Nov 2024 15:47:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-18 15:38:44.474977
- Title: The ParClusterers Benchmark Suite (PCBS): A Fine-Grained Analysis of Scalable Graph Clustering
- Title(参考訳): ParClusterers Benchmark Suite (PCBS) - スケーラブルグラフクラスタリングの詳細な解析
- Authors: Shangdi Yu, Jessica Shi, Jamison Meindl, David Eisenstat, Xiaoen Ju, Sasan Tavakkol, Laxman Dhulipala, Jakub Łącki, Vahab Mirrokni, Julian Shun,
- Abstract要約: ParClusterers Benchmark Suite (PCBS)は、高度にスケーラブルな並列グラフクラスタリングアルゴリズムとベンチマークツールのコレクションである。
PCBSは、スケーラブルなグラフクラスタリングアルゴリズムのアクティブな研究領域の品質とパフォーマンスのトレードオフを評価し、判断する標準化された方法を提供する。
- 参考スコア(独自算出の注目度): 15.047567897051376
- License:
- Abstract: We introduce the ParClusterers Benchmark Suite (PCBS) -- a collection of highly scalable parallel graph clustering algorithms and benchmarking tools that streamline comparing different graph clustering algorithms and implementations. The benchmark includes clustering algorithms that target a wide range of modern clustering use cases, including community detection, classification, and dense subgraph mining. The benchmark toolkit makes it easy to run and evaluate multiple instances of different clustering algorithms, which can be useful for fine-tuning the performance of clustering on a given task, and for comparing different clustering algorithms based on different metrics of interest, including clustering quality and running time. Using PCBS, we evaluate a broad collection of real-world graph clustering datasets. Somewhat surprisingly, we find that the best quality results are obtained by algorithms that not included in many popular graph clustering toolkits. The PCBS provides a standardized way to evaluate and judge the quality-performance tradeoffs of the active research area of scalable graph clustering algorithms. We believe it will help enable fair, accurate, and nuanced evaluation of graph clustering algorithms in the future.
- Abstract(参考訳): ParClusterers Benchmark Suite (PCBS)は,グラフクラスタリングアルゴリズムと実装の比較を合理化する,高度にスケーラブルな並列グラフクラスタリングアルゴリズムとベンチマークツールのコレクションである。
このベンチマークには、コミュニティ検出、分類、密度の高いサブグラフマイニングを含む、幅広い現代的なクラスタリングユースケースをターゲットにしたクラスタリングアルゴリズムが含まれている。
ベンチマークツールキットは、異なるクラスタリングアルゴリズムの複数のインスタンスの実行と評価を簡単にします。これは、与えられたタスク上でクラスタリングのパフォーマンスを微調整したり、クラスタリングの品質や実行時間など、さまざまなメトリクスに基づいて異なるクラスタリングアルゴリズムを比較するのに役立ちます。
PCBSを用いて、実世界のグラフクラスタリングデータセットの広範なコレクションを評価する。
驚くべきことに、最高の品質結果は、多くの人気のあるグラフクラスタリングツールキットに含まれていないアルゴリズムによって得られます。
PCBSは、スケーラブルグラフクラスタリングアルゴリズムのアクティブな研究領域の品質とパフォーマンスのトレードオフを評価し、判断する標準化された方法を提供する。
将来的には、グラフクラスタリングアルゴリズムの公平で正確でニュアンスな評価を可能にすると信じています。
関連論文リスト
- Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - GLCC: A General Framework for Graph-level Clustering [5.069852282550117]
本稿では,グラフレベルのクラスタリングの問題について検討する。
GLCC(Graph-Level Contrastive Clustering)というグラフレベルの一般的なクラスタリングフレームワークを提案する。
様々なよく知られたデータセットに対する実験は、競合するベースラインよりも提案したGLCCの方が優れていることを示す。
論文 参考訳(メタデータ) (2022-10-21T11:08:10Z) - A framework for benchmarking clustering algorithms [2.900810893770134]
クラスタリングアルゴリズムは、さまざまなベンチマーク問題でテストできる。
多くの研究論文や大学院論文では、少数のデータセットしか考慮していない。
我々はクラスタリングアルゴリズムをテストする一貫した方法論を導入することを目的としたフレームワークを開発した。
論文 参考訳(メタデータ) (2022-09-20T06:10:41Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Graph Contrastive Clustering [131.67881457114316]
本稿では,クラスタリングタスクに適用可能な新しいグラフコントラスト学習フレームワークを提案し,gcc(graph constrastive clustering)法を考案した。
特に、グラフラプラシアンに基づくコントラスト損失は、より識別的かつクラスタリングフレンドリーな特徴を学ぶために提案されている。
一方で、よりコンパクトなクラスタリング割り当てを学ぶために、グラフベースのコントラスト学習戦略が提案されている。
論文 参考訳(メタデータ) (2021-04-03T15:32:49Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Structured Graph Learning for Clustering and Semi-supervised
Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。
本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。
我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文 参考訳(メタデータ) (2020-08-31T08:41:20Z) - Comparison and Benchmark of Graph Clustering Algorithms [6.106697372971535]
私たちは、70以上のグラフクラスタリングプログラムをベンチマークして、実行時と品質のパフォーマンスを評価しました。
私たちの研究は、エンジニアがクラスタリングアルゴリズムを選択するための出発点を提供するだけでなく、研究者が新しいアルゴリズムを設計するための視点を提供することができます。
論文 参考訳(メタデータ) (2020-05-10T22:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。