論文の概要: cuSLINK: Single-linkage Agglomerative Clustering on the GPU
- arxiv url: http://arxiv.org/abs/2306.16354v1
- Date: Wed, 28 Jun 2023 16:34:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-29 13:25:42.876171
- Title: cuSLINK: Single-linkage Agglomerative Clustering on the GPU
- Title(参考訳): cuSLINK:GPU上の単一リンク集約クラスタリング
- Authors: Corey J. Nolet, Divye Gala, Alex Fender, Mahesh Doijade, Joe Eaton,
Edward Raff, John Zedlewski, Brad Rees, Tim Oates
- Abstract要約: 我々は,GPU上でのSlinkアルゴリズムの新規かつ最先端の再構成であるcuSLinkを提案する。
我々は、プリミティブをGPU上でcuSLinkのエンドツーエンド実装にどのように使ったかを示します。
我々のアルゴリズムの影響は、ソーシャルおよびコンピュータネットワークにおけるクラスタ分析、自然言語処理、コンピュータビジョンなど、幅広い重要な応用に及んでいる。
- 参考スコア(独自算出の注目度): 25.568465070956915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose cuSLINK, a novel and state-of-the-art reformulation
of the SLINK algorithm on the GPU which requires only $O(Nk)$ space and uses a
parameter $k$ to trade off space and time. We also propose a set of novel and
reusable building blocks that compose cuSLINK. These building blocks include
highly optimized computational patterns for $k$-NN graph construction, spanning
trees, and dendrogram cluster extraction. We show how we used our primitives to
implement cuSLINK end-to-end on the GPU, further enabling a wide range of
real-world data mining and machine learning applications that were once
intractable. In addition to being a primary computational bottleneck in the
popular HDBSCAN algorithm, the impact of our end-to-end cuSLINK algorithm spans
a large range of important applications, including cluster analysis in social
and computer networks, natural language processing, and computer vision. Users
can obtain cuSLINK at
https://docs.rapids.ai/api/cuml/latest/api/#agglomerative-clustering
- Abstract(参考訳): 本稿では,GPU上のSLINKアルゴリズムの新規かつ最先端の再構成であるcuSLINKを提案する。
また,cuslinkを構成する新規かつ再利用可能なビルディングブロックのセットを提案する。
これらのビルディングブロックには、$k$-NNグラフ構築、スパンニングツリー、デンドログラムクラスタ抽出のための高度に最適化された計算パターンが含まれている。
我々は、プリミティブをGPU上でcuSLINKのエンドツーエンド実装にどのように使用したかを示し、さらに、かつて難解だったさまざまな現実世界のデータマイニングと機械学習アプリケーションを可能にしました。
HDBSCANアルゴリズムの主要な計算ボトルネックであるだけでなく、我々のエンドツーエンドのcuSLINKアルゴリズムの影響は、ソーシャルおよびコンピュータネットワークにおけるクラスタ分析、自然言語処理、コンピュータビジョンなど、幅広い重要な応用に及んでいる。
cuSLINKはhttps://docs.rapids.ai/api/cuml/latest/api/#agglomerative-clusteringで入手できる。
関連論文リスト
- Quiver: Supporting GPUs for Low-Latency, High-Throughput GNN Serving
with Workload Awareness [4.8412870364335925]
Quiverは、低レイテンシと高スループットを備えた分散GPUベースのGNNサービスシステムである。
最新のGNN手法と比較して,Quiverは8倍のスループットで最大35倍のレイテンシを実現している。
論文 参考訳(メタデータ) (2023-05-18T10:34:23Z) - Communication-Efficient Adam-Type Algorithms for Distributed Data Mining [93.50424502011626]
我々はスケッチを利用した新しい分散Adam型アルゴリズムのクラス(例:SketchedAMSGrad)を提案する。
我々の新しいアルゴリズムは、反復毎に$O(frac1sqrtnT + frac1(k/d)2 T)$の高速収束率を$O(k log(d))$の通信コストで達成する。
論文 参考訳(メタデータ) (2022-10-14T01:42:05Z) - Scalable Deep Graph Clustering with Random-walk based Self-supervised
Learning [0.0]
スケーラブルなディープクラスタリングアルゴリズムであるRwSLは、100万以上のノードを持つグラフを超えてスケールし続けることができることを示す。
また、RwSLが1つのGPUのみを使用して、1.8億のエッジを持つグラフ上でノードクラスタリングを実行する方法を実証した。
論文 参考訳(メタデータ) (2021-12-31T16:12:23Z) - Synthesizing Collective Communication Algorithms for Heterogeneous
Networks with TACCL [1.5528708400965123]
大規模マルチGPUシステムのための集合通信プリミティブのためのシンセサイザーであるTACCLを提案する。
TACCLは、プロファイルトポロジと入力サイズを合成問題にエンコードし、最適化された通信アルゴリズムを生成する。
TACCLのアルゴリズムを使用することで、エキスパートモデルの内部混合のエンドツーエンドトレーニングを17%スピードアップする。
論文 参考訳(メタデータ) (2021-11-08T23:20:52Z) - VersaGNN: a Versatile accelerator for Graph neural networks [81.1667080640009]
我々は,超効率的なサイストリックアレイベースの多用途ハードウェアアクセラレータである textitVersaGNN を提案する。
textitVersaGNNは平均3712$times$ speedup with 1301.25$times$ energy reduction on CPU、35.4$times$ speedup with 17.66$times$ energy reduction on GPUを達成している。
論文 参考訳(メタデータ) (2021-05-04T04:10:48Z) - DistGNN: Scalable Distributed Training for Large-Scale Graph Neural
Networks [58.48833325238537]
大規模グラフの構造を学ぶためにGNN(Graph Neural Networks)のフルバッチトレーニングは、実現可能な数百の計算ノードにスケールする必要がある重要な問題です。
本稿では,CPUクラスタ上でのフルバッチトレーニングのためのDGL(Deep Graph Library)を最適化したGNNについて述べる。
4つの一般的なGNNベンチマークデータセットの結果は、1つのCPUソケットを使用して最大3.7倍のスピードアップ、128のCPUソケットを使用して最大97倍のスピードアップを示す。
論文 参考訳(メタデータ) (2021-04-14T08:46:35Z) - Towards Efficient Graph Convolutional Networks for Point Cloud Handling [181.59146413326056]
ポイントクラウド上で学習するためのグラフ畳み込みネットワーク(GCN)の計算効率の向上を目指します。
一連の実験により、最適化されたネットワークは計算複雑性を減らし、メモリ消費を減らし、推論速度を加速した。
論文 参考訳(メタデータ) (2021-04-12T17:59:16Z) - Rethinking Graph Neural Network Search from Message-passing [120.62373472087651]
本稿では,新しい検索空間を設計したグラフニューラルアーキテクチャサーチ(GNAS)を提案する。
グラフニューラルアーキテクチャパラダイム(GAP:Graph Neural Architecture Paradigm)をツリートポロジー計算手順と2種類の微粒原子操作で設計します。
実験では、GNASは複数のメッセージ通過機構と最適なメッセージ通過深さを持つより良いGNNを探索できることを示しています。
論文 参考訳(メタデータ) (2021-03-26T06:10:41Z) - Graph Neural Networks with Composite Kernels [60.81504431653264]
カーネル重み付けの観点からノード集約を再解釈する。
本稿では,アグリゲーション方式における特徴類似性を考慮したフレームワークを提案する。
特徴空間における特徴類似性をエンコードするために,元の隣り合うカーネルと学習可能なカーネルの合成として特徴集約を提案する。
論文 参考訳(メタデータ) (2020-05-16T04:44:29Z) - Heterogeneous CPU+GPU Stochastic Gradient Descent Algorithms [1.3249453757295084]
ヘテロジニアスCPU+GPUアーキテクチャの深層学習のためのトレーニングアルゴリズムについて検討する。
私たちの2倍の目標 -- 収束率と資源利用を同時に最大化する -- は、この問題を難しくします。
これらのアルゴリズムの実装は,複数の実データセットよりも高速な収束と資源利用の両立を実現していることを示す。
論文 参考訳(メタデータ) (2020-04-19T05:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。