論文の概要: FeLoG: Scalable and Efficient Distributed Graph Embedding with Feedback Loop Mechanism
- arxiv url: http://arxiv.org/abs/2606.22180v1
- Date: Sat, 20 Jun 2026 18:21:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 22:16:03.55415
- Title: FeLoG: Scalable and Efficient Distributed Graph Embedding with Feedback Loop Mechanism
- Title(参考訳): FeLoG: フィードバックループ機構を備えたスケーラブルで効率的な分散グラフ埋め込み
- Authors: Peng Fang, Arijit Khan, Ziqiang Wu, Zhenli Li, Yibo Zhou, Fang Wang, Dan Feng,
- Abstract要約: スケーラブルな分散グラフ埋め込みのためのフィードバックループ駆動システムFeLoGを提案する。
フィードバックを結合したサンプリングとトレーニングを導入し、リアルタイムな埋め込み品質のフィードバックに従って、トレーニングされていないノードを動的に優先順位付けする。
27.9倍のスピードアップを実現し、通信コストを53.1%以上削減し、CPU-GPU使用率を80%以上維持する。
- 参考スコア(独自算出の注目度): 10.118550615899972
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Graph embedding maps graph nodes into low-dimensional vectors to support applications such as recommendation, fraud detection, and graph-based retrieval-augmented generation (GraphRAG). As graphs scale to billions of edges, scalable and efficient graph embedding has become increasingly important. Existing frameworks commonly adopt a sampling-training paradigm, in which mini-batches are constructed by sampling nodes and their neighbors. However, sampling is typically decoupled from evolving embedding quality, causing redundant exploration of well-trained regions while under-sampling undertrained nodes. At the system level, such decoupling further leads to excessive communication, serialized execution, and low resource utilization in distributed environments. We present FeLoG, a feedback loop-driven system for scalable distributed graph embedding. (1) FeLoG introduces feedback-coupled sampling and training, dynamically prioritizing undertrained nodes according to real-time embedding-quality feedback, thereby reducing redundant computation and accelerating convergence. (2) It employs activity-aware communication that compresses frequently occurring node sequences to reduce intra-machine PCIe traffic and selectively synchronizes frequently updated embeddings to reduce inter-machine communication. (3) It adopts a round-interleaved pipeline that overlaps next-round sampling with current-round training to improve CPU-GPU utilization. Experiments against six state-of-the-art baselines on large-scale graphs show that FeLoG achieves an average speedup of 27.9x, reduces communication cost by more than 53.1%, and sustains over 80% CPU-GPU utilization.
- Abstract(参考訳): グラフ埋め込みは、グラフノードを低次元ベクトルにマッピングし、レコメンデーション、不正検出、グラフベースの検索拡張生成(GraphRAG)などのアプリケーションをサポートする。
グラフが数十億のエッジにスケールするにつれ、スケーラブルで効率的なグラフ埋め込みがますます重要になっている。
既存のフレームワークではサンプリングトレーニングのパラダイムが一般的であり、ミニバッチはサンプリングノードとその隣人によって構築される。
しかし、サンプリングは通常、埋め込み品質の進化から切り離され、未サンプリングノードをアンダーサンプリングしながら、よく訓練された領域を冗長に探索する。
システムレベルでは、このような分離は、分散環境での過剰な通信、シリアライズされた実行、低リソース利用につながる。
スケーラブルな分散グラフ埋め込みのためのフィードバックループ駆動システムFeLoGを提案する。
1)FeLoGは,フィードバック結合型サンプリングとトレーニングを導入し,リアルタイムな埋め込み品質フィードバックに基づいて非学習ノードを動的に優先順位付けすることで,冗長な計算を削減し,収束を加速する。
2) 頻繁に発生するノードシーケンスを圧縮してマシン内PCIeトラフィックを低減し, 頻繁に更新される埋め込みを選択的に同期させ, マシン間通信を減らす。
(3) CPU-GPU利用を改善するために、次のラウンドサンプリングと現在のラウンドトレーニングの重複するラウンドインターリーブパイプラインを採用する。
大規模グラフ上の6つの最先端ベースラインに対する実験により、FeLoGは平均速度を27.9倍にし、通信コストを53.1%以上削減し、CPU-GPU使用率を80%以上維持している。
関連論文リスト
- Rethinking Efficient Graph Coarsening via a Non-Selfishness Principle [56.92868481531399]
粗大化における近隣住民の集団干渉を優先する非利己的原則を提案する。
局所等方性仮定に基づいて、O(dot d)干渉評価をO(d)に還元する高速なNOPE*を導出する。
粗いグラフの学習は、元のグラフに匹敵する性能を示し、LLMベースのグラフ推論よりも優れた性能を示すことができる。
論文 参考訳(メタデータ) (2026-05-13T05:24:35Z) - NOMAD: Generating Embeddings for Massive Distributed Graphs [10.29444459089447]
グラフやネットワーク上で成功した機械学習は、ノードとエッジを低次元ベクトルとして表現する埋め込みを必要とする。
本稿では,分散グラフのためのメッセージパッシングインタフェース(MPI)を用いた分散メモリグラフ埋め込みフレームワークであるNOMADを提案する。
論文 参考訳(メタデータ) (2026-04-10T15:30:43Z) - MassiveGNN: Efficient Training via Prefetching for Massively Connected Distributed Graphs [11.026326555186333]
本稿では,現在最先端のAmazon DistDGL分散GNNフレームワーク上に,パラメータ化された連続プリフェッチと消去方式を提案する。
NERSC(National Energy Research Scientific Computing Center)のPerlmutterスーパーコンピュータでは、エンドツーエンドのトレーニング性能が15~40%向上している。
論文 参考訳(メタデータ) (2024-10-30T05:10:38Z) - Efficient Heterogeneous Graph Learning via Random Projection [58.4138636866903]
不均一グラフニューラルネットワーク(HGNN)は、異種グラフを深層学習するための強力なツールである。
最近のプリ計算ベースのHGNNは、一時間メッセージパッシングを使用して不均一グラフを正規形テンソルに変換する。
我々はRandom Projection Heterogeneous Graph Neural Network (RpHGNN) というハイブリッド計算前HGNNを提案する。
論文 参考訳(メタデータ) (2023-10-23T01:25:44Z) - Communication-Free Distributed GNN Training with Vertex Cut [63.22674903170953]
CoFree-GNNは、コミュニケーションのないトレーニングを実装することで、トレーニングプロセスを大幅に高速化する、分散GNNトレーニングフレームワークである。
我々は、CoFree-GNNが既存の最先端のGNNトレーニングアプローチよりも最大10倍高速なGNNトレーニングプロセスを実証した。
論文 参考訳(メタデータ) (2023-08-06T21:04:58Z) - Communication-Efficient Graph Neural Networks with Probabilistic
Neighborhood Expansion Analysis and Caching [59.8522166385372]
大規模グラフ上でのグラフニューラルネットワーク(GNN)のトレーニングと推論は、GNNの登場以来活発に研究されている。
本稿では,分散環境におけるノードワイドサンプリングを用いたGNNによるミニバッチ学習と推論について述べる。
分割された特徴データを扱うために,従来のSALIENTシステムを拡張したSALIENT++を提案する。
論文 参考訳(メタデータ) (2023-05-04T21:04:01Z) - EGRC-Net: Embedding-induced Graph Refinement Clustering Network [66.44293190793294]
埋め込みによるグラフリファインメントクラスタリングネットワーク (EGRC-Net) という新しいグラフクラスタリングネットワークを提案する。
EGRC-Netは学習した埋め込みを利用して初期グラフを適応的に洗練し、クラスタリング性能を向上させる。
提案手法はいくつかの最先端手法より一貫して優れている。
論文 参考訳(メタデータ) (2022-11-19T09:08:43Z) - ItNet: iterative neural networks with small graphs for accurate and
efficient anytime prediction [1.52292571922932]
本研究では,計算グラフの観点から,メモリフットプリントが小さいネットワークモデルについて紹介する。
CamVidおよびCityscapesデータセットでセマンティックセグメンテーションの最新の結果を示します。
論文 参考訳(メタデータ) (2021-01-21T15:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。