Fugu-MT 論文翻訳(概要): GNNPipe: Accelerating Distributed Full-Graph GNN Training with Pipelined Model Parallelism

論文の概要: GNNPipe: Accelerating Distributed Full-Graph GNN Training with Pipelined Model Parallelism

arxiv url: http://arxiv.org/abs/2308.10087v1
Date: Sat, 19 Aug 2023 18:44:14 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-22 17:58:05.255107
Title: GNNPipe: Accelerating Distributed Full-Graph GNN Training with Pipelined Model Parallelism
Title（参考訳）: GNNPipe:パイプラインモデル並列処理による分散フルグラフGNNトレーニングの高速化
Authors: Jingji Chen, Zhuoming Chen, Xuehai Qian
Abstract要約: 現在の分散フルグラフGNNトレーニング手法は、データ並列性の変種、すなわちグラフ並列性を採用している。そこで本研究では,モデル並列性を用いたGNNPipeという新たなトレーニング手法を提案する。提案手法は, 平均2.45倍(平均2.03倍)の訓練時間を短縮し, 通信量とオーバーヘッドを最大22.51倍, 27.21倍に短縮する。
参考スコア（独自算出の注目度）: 10.723541176359452
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Current distributed full-graph GNN training methods adopt a variant of data parallelism, namely graph parallelism, in which the whole graph is divided into multiple partitions (subgraphs) and each GPU processes one of them. This incurs high communication overhead because of the inter-partition message passing at each layer. To this end, we proposed a new training method named GNNPipe that adopts model parallelism instead, which has a lower worst-case asymptotic communication complexity than graph parallelism. To ensure high GPU utilization, we proposed to combine model parallelism with a chunk-based pipelined training method, in which each GPU processes a different chunk of graph data at different layers concurrently. We further proposed hybrid parallelism that combines model and graph parallelism when the model-level parallelism is insufficient. We also introduced several tricks to ensure convergence speed and model accuracies to accommodate embedding staleness introduced by pipelining. Extensive experiments show that our method reduces the per-epoch training time by up to 2.45x (on average 2.03x) and reduces the communication volume and overhead by up to 22.51x and 27.21x (on average 10.27x and 14.96x), respectively, while achieving a comparable level of model accuracy and convergence speed compared to graph parallelism.
Abstract（参考訳）: 現在の分散フルグラフGNNトレーニング手法では、グラフ並列性の変種が採用されており、グラフ全体を複数のパーティション(グラフ)に分割し、各GPUがそのうちの1つを処理する。これにより、各層でメッセージ間が通過するため、高い通信オーバーヘッドが発生する。そこで我々は,グラフ並列性よりも最悪の場合の漸近的通信複雑性が低いモデル並列性を取り入れた新しい学習法であるgnnpipeを提案する。高いGPU利用を確保するため,各GPUが異なる階層のグラフデータを同時に処理するチャンクベースのパイプライントレーニング手法とモデル並列性を組み合わせることを提案した。さらに,モデルレベルの並列性が不十分な場合,モデルとグラフの並列性を組み合わせたハイブリッド並列性を提案する。また,パイプライニングによる埋め込み安定化に対応するため,収束速度とモデル精度を確保するためのいくつかの手法も導入した。実験の結果,平均2.45倍 (平均2.03倍),通信量とオーバーヘッドを最大22.51倍 (平均10.27倍), 平均27.21倍 (平均14.96倍) まで低減し, グラフ並列性と比較してモデル精度と収束速度の同等レベルを実現した。

関連論文リスト

Plexus: Taming Billion-edge Graphs with 3D Parallel Full-graph GNN Training [5.1420473428862605]
グラフニューラルネットワーク(GNN)は、実世界のグラフの接続性と構造を利用して、ノード間の複雑な特性と関係を学習する。多くの実世界のグラフはGPUのメモリ容量を超えており、そのようなグラフ上でのGNNのトレーニングには、スケールするためにミニバッチサンプリングのような技術が必要である。本稿では、これらの問題に対処し、数十億のエッジグラフにスケールするフルグラフトレーニングのための3次元並列アプローチを提案する。
論文参考訳（メタデータ） (2025-05-07T02:49:52Z)
Learning to Reweight for Graph Neural Network [63.978102332612906]
グラフニューラルネットワーク(GNN)は、グラフタスクに対して有望な結果を示す。既存のGNNの一般化能力は、テストとトレーニンググラフデータの間に分散シフトが存在する場合に低下する。本稿では,分布外一般化能力を大幅に向上させる非線形グラフデコリレーション法を提案する。
論文参考訳（メタデータ） (2023-12-19T12:25:10Z)
T-GAE: Transferable Graph Autoencoder for Network Alignment [79.89704126746204]
T-GAEはグラフオートエンコーダフレームワークで、GNNの転送性と安定性を活用して、再トレーニングなしに効率的なネットワークアライメントを実現する。実験の結果、T-GAEは最先端の最適化手法と最高のGNN手法を最大38.7%、50.8%で上回っていることがわかった。
論文参考訳（メタデータ） (2023-10-05T02:58:29Z)
Communication-Free Distributed GNN Training with Vertex Cut [63.22674903170953]
CoFree-GNNは、コミュニケーションのないトレーニングを実装することで、トレーニングプロセスを大幅に高速化する、分散GNNトレーニングフレームワークである。我々は、CoFree-GNNが既存の最先端のGNNトレーニングアプローチよりも最大10倍高速なGNNトレーニングプロセスを実証した。
論文参考訳（メタデータ） (2023-08-06T21:04:58Z)
Graph Ladling: Shockingly Simple Parallel GNN Training without Intermediate Communication [100.51884192970499]
GNNは、グラフを学習するニューラルネットワークの強力なファミリーである。 GNNのスケーリングは、肥大化または拡大によって、不健康な勾配、過度なスムースメント、情報のスカッシングといった問題に悩まされる。本稿では,現在のGNNの深層化や拡張ではなく,GNNに適したモデルスープをデータ中心の視点で表現することを提案する。
論文参考訳（メタデータ） (2023-06-18T03:33:46Z)
Training Graph Neural Networks on Growing Stochastic Graphs [114.75710379125412]
グラフニューラルネットワーク(GNN)は、ネットワーク化されたデータの意味のあるパターンを活用するために、グラフ畳み込みに依存している。我々は,成長するグラフ列の極限オブジェクトであるグラフオンを利用して,非常に大きなグラフ上のGNNを学習することを提案する。
論文参考訳（メタデータ） (2022-10-27T16:00:45Z)
Distributed Graph Neural Network Training with Periodic Historical Embedding Synchronization [9.503080586294406]
グラフニューラルネットワーク(GNN)は、ソーシャルネットワーク、レコメンダシステム、ナレッジグラフなどの様々なアプリケーションで広く使われている。従来のサンプリングベースの手法は、エッジとノードをドロップすることでGNNを加速し、グラフの整合性とモデル性能を損なう。本稿では,新しい分散GNNトレーニングフレームワークであるDIstributed Graph Embedding SynchronizaTion (DIGEST)を提案する。
論文参考訳（メタデータ） (2022-05-31T18:44:53Z)
Parallel and Distributed Graph Neural Networks: An In-Depth Concurrency Analysis [28.464210819376593]
グラフニューラルネットワーク(GNN)は、ディープラーニングにおいて最も強力なツールのひとつだ。ノード分類、グラフ分類、リンク予測などの非構造化ネットワーク上の複雑な問題を高精度に解決する。しかし、GNNの推論とトレーニングは複雑であり、不規則なグラフ処理の特徴と密度と正規な計算を一意に組み合わせている。この複雑さは、現代の大規模並列アーキテクチャ上でGNNを効率的に実行することを非常に困難にしている。
論文参考訳（メタデータ） (2022-05-19T17:11:45Z)
A Unified Lottery Ticket Hypothesis for Graph Neural Networks [82.31087406264437]
本稿では,グラフ隣接行列とモデルの重み付けを同時に行う統一GNNスペーシフィケーション(UGS)フレームワークを提案する。グラフ宝くじ(GLT)をコアサブデータセットとスパースサブネットワークのペアとして定義することにより、人気のある宝くじチケット仮説を初めてGNNsにさらに一般化します。
論文参考訳（メタデータ） (2021-02-12T21:52:43Z)
Accurate, Efficient and Scalable Training of Graph Neural Networks [9.569918335816963]
グラフニューラルネットワーク(GNN)は、グラフ上にノード埋め込みを生成する強力なディープラーニングモデルである。効率的でスケーラブルな方法でトレーニングを実行することは依然として困難です。本稿では,最先端のミニバッチ手法と比較して,トレーニング負荷を桁違いに削減する新しい並列トレーニングフレームワークを提案する。
論文参考訳（メタデータ） (2020-10-05T22:06:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。