論文の概要: GNNPipe: Accelerating Distributed Full-Graph GNN Training with Pipelined
Model Parallelism
- arxiv url: http://arxiv.org/abs/2308.10087v1
- Date: Sat, 19 Aug 2023 18:44:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-22 17:58:05.255107
- Title: GNNPipe: Accelerating Distributed Full-Graph GNN Training with Pipelined
Model Parallelism
- Title(参考訳): GNNPipe:パイプラインモデル並列処理による分散フルグラフGNNトレーニングの高速化
- Authors: Jingji Chen, Zhuoming Chen, Xuehai Qian
- Abstract要約: 現在の分散フルグラフGNNトレーニング手法は、データ並列性の変種、すなわちグラフ並列性を採用している。
そこで本研究では,モデル並列性を用いたGNNPipeという新たなトレーニング手法を提案する。
提案手法は, 平均2.45倍(平均2.03倍)の訓練時間を短縮し, 通信量とオーバーヘッドを最大22.51倍, 27.21倍に短縮する。
- 参考スコア(独自算出の注目度): 10.723541176359452
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current distributed full-graph GNN training methods adopt a variant of data
parallelism, namely graph parallelism, in which the whole graph is divided into
multiple partitions (subgraphs) and each GPU processes one of them. This incurs
high communication overhead because of the inter-partition message passing at
each layer. To this end, we proposed a new training method named GNNPipe that
adopts model parallelism instead, which has a lower worst-case asymptotic
communication complexity than graph parallelism. To ensure high GPU
utilization, we proposed to combine model parallelism with a chunk-based
pipelined training method, in which each GPU processes a different chunk of
graph data at different layers concurrently. We further proposed hybrid
parallelism that combines model and graph parallelism when the model-level
parallelism is insufficient. We also introduced several tricks to ensure
convergence speed and model accuracies to accommodate embedding staleness
introduced by pipelining. Extensive experiments show that our method reduces
the per-epoch training time by up to 2.45x (on average 2.03x) and reduces the
communication volume and overhead by up to 22.51x and 27.21x (on average 10.27x
and 14.96x), respectively, while achieving a comparable level of model accuracy
and convergence speed compared to graph parallelism.
- Abstract(参考訳): 現在の分散フルグラフGNNトレーニング手法では、グラフ並列性の変種が採用されており、グラフ全体を複数のパーティション(グラフ)に分割し、各GPUがそのうちの1つを処理する。
これにより、各層でメッセージ間が通過するため、高い通信オーバーヘッドが発生する。
そこで我々は,グラフ並列性よりも最悪の場合の漸近的通信複雑性が低いモデル並列性を取り入れた新しい学習法であるgnnpipeを提案する。
高いGPU利用を確保するため,各GPUが異なる階層のグラフデータを同時に処理するチャンクベースのパイプライントレーニング手法とモデル並列性を組み合わせることを提案した。
さらに,モデルレベルの並列性が不十分な場合,モデルとグラフの並列性を組み合わせたハイブリッド並列性を提案する。
また,パイプライニングによる埋め込み安定化に対応するため,収束速度とモデル精度を確保するためのいくつかの手法も導入した。
実験の結果,平均2.45倍 (平均2.03倍),通信量とオーバーヘッドを最大22.51倍 (平均10.27倍), 平均27.21倍 (平均14.96倍) まで低減し, グラフ並列性と比較してモデル精度と収束速度の同等レベルを実現した。
関連論文リスト
- Learning to Reweight for Graph Neural Network [63.978102332612906]
グラフニューラルネットワーク(GNN)は、グラフタスクに対して有望な結果を示す。
既存のGNNの一般化能力は、テストとトレーニンググラフデータの間に分散シフトが存在する場合に低下する。
本稿では,分布外一般化能力を大幅に向上させる非線形グラフデコリレーション法を提案する。
論文 参考訳(メタデータ) (2023-12-19T12:25:10Z) - T-GAE: Transferable Graph Autoencoder for Network Alignment [79.89704126746204]
T-GAEはグラフオートエンコーダフレームワークで、GNNの転送性と安定性を活用して、再トレーニングなしに効率的なネットワークアライメントを実現する。
実験の結果、T-GAEは最先端の最適化手法と最高のGNN手法を最大38.7%、50.8%で上回っていることがわかった。
論文 参考訳(メタデータ) (2023-10-05T02:58:29Z) - Communication-Free Distributed GNN Training with Vertex Cut [63.22674903170953]
CoFree-GNNは、コミュニケーションのないトレーニングを実装することで、トレーニングプロセスを大幅に高速化する、分散GNNトレーニングフレームワークである。
我々は、CoFree-GNNが既存の最先端のGNNトレーニングアプローチよりも最大10倍高速なGNNトレーニングプロセスを実証した。
論文 参考訳(メタデータ) (2023-08-06T21:04:58Z) - Graph Ladling: Shockingly Simple Parallel GNN Training without
Intermediate Communication [100.51884192970499]
GNNは、グラフを学習するニューラルネットワークの強力なファミリーである。
GNNのスケーリングは、肥大化または拡大によって、不健康な勾配、過度なスムースメント、情報のスカッシングといった問題に悩まされる。
本稿では,現在のGNNの深層化や拡張ではなく,GNNに適したモデルスープをデータ中心の視点で表現することを提案する。
論文 参考訳(メタデータ) (2023-06-18T03:33:46Z) - Training Graph Neural Networks on Growing Stochastic Graphs [114.75710379125412]
グラフニューラルネットワーク(GNN)は、ネットワーク化されたデータの意味のあるパターンを活用するために、グラフ畳み込みに依存している。
我々は,成長するグラフ列の極限オブジェクトであるグラフオンを利用して,非常に大きなグラフ上のGNNを学習することを提案する。
論文 参考訳(メタデータ) (2022-10-27T16:00:45Z) - Distributed Graph Neural Network Training with Periodic Historical
Embedding Synchronization [9.503080586294406]
グラフニューラルネットワーク(GNN)は、ソーシャルネットワーク、レコメンダシステム、ナレッジグラフなどの様々なアプリケーションで広く使われている。
従来のサンプリングベースの手法は、エッジとノードをドロップすることでGNNを加速し、グラフの整合性とモデル性能を損なう。
本稿では,新しい分散GNNトレーニングフレームワークであるDIstributed Graph Embedding SynchronizaTion (DIGEST)を提案する。
論文 参考訳(メタデータ) (2022-05-31T18:44:53Z) - Parallel and Distributed Graph Neural Networks: An In-Depth Concurrency
Analysis [28.464210819376593]
グラフニューラルネットワーク(GNN)は、ディープラーニングにおいて最も強力なツールのひとつだ。
ノード分類、グラフ分類、リンク予測などの非構造化ネットワーク上の複雑な問題を高精度に解決する。
しかし、GNNの推論とトレーニングは複雑であり、不規則なグラフ処理の特徴と密度と正規な計算を一意に組み合わせている。
この複雑さは、現代の大規模並列アーキテクチャ上でGNNを効率的に実行することを非常に困難にしている。
論文 参考訳(メタデータ) (2022-05-19T17:11:45Z) - A Unified Lottery Ticket Hypothesis for Graph Neural Networks [82.31087406264437]
本稿では,グラフ隣接行列とモデルの重み付けを同時に行う統一GNNスペーシフィケーション(UGS)フレームワークを提案する。
グラフ宝くじ(GLT)をコアサブデータセットとスパースサブネットワークのペアとして定義することにより、人気のある宝くじチケット仮説を初めてGNNsにさらに一般化します。
論文 参考訳(メタデータ) (2021-02-12T21:52:43Z) - Accurate, Efficient and Scalable Training of Graph Neural Networks [9.569918335816963]
グラフニューラルネットワーク(GNN)は、グラフ上にノード埋め込みを生成する強力なディープラーニングモデルである。
効率的でスケーラブルな方法でトレーニングを実行することは依然として困難です。
本稿では,最先端のミニバッチ手法と比較して,トレーニング負荷を桁違いに削減する新しい並列トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-05T22:06:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。