論文の概要: GiGL: Large-Scale Graph Neural Networks at Snapchat
- arxiv url: http://arxiv.org/abs/2502.15054v1
- Date: Thu, 20 Feb 2025 21:29:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-24 19:42:20.105609
- Title: GiGL: Large-Scale Graph Neural Networks at Snapchat
- Title(参考訳): GiGL: Snapchatの大規模グラフニューラルネットワーク
- Authors: Tong Zhao, Yozen Liu, Matthew Kolodner, Kyle Montemayor, Elham Ghazizadeh, Ankit Batra, Zihao Fan, Xiaobin Gao, Xuan Guo, Jiwen Ren, Serim Park, Peicheng Yu, Jun Yu, Shubham Vij, Neil Shah,
- Abstract要約: 大規模分散グラフMLを実現するオープンソースライブラリであるGiGL(Gigantic Graph Learning)を提案する。
私たちはSnapchat社内でGGLを使用して、リレーショナルDBからのグラフデータ前処理を含むGNNの重い処理を管理しています。
GiGLは複数のプロダクション環境で使用されており、過去2年間に複数のビジネスドメインで35回以上のローンチを実行している。
- 参考スコア(独自算出の注目度): 32.1186726452899
- License:
- Abstract: Recent advances in graph machine learning (ML) with the introduction of Graph Neural Networks (GNNs) have led to a widespread interest in applying these approaches to business applications at scale. GNNs enable differentiable end-to-end (E2E) learning of model parameters given graph structure which enables optimization towards popular node, edge (link) and graph-level tasks. While the research innovation in new GNN layers and training strategies has been rapid, industrial adoption and utility of GNNs has lagged considerably due to the unique scale challenges that large-scale graph ML problems create. In this work, we share our approach to training, inference, and utilization of GNNs at Snapchat. To this end, we present GiGL (Gigantic Graph Learning), an open-source library to enable large-scale distributed graph ML to the benefit of researchers, ML engineers, and practitioners. We use GiGL internally at Snapchat to manage the heavy lifting of GNN workflows, including graph data preprocessing from relational DBs, subgraph sampling, distributed training, inference, and orchestration. GiGL is designed to interface cleanly with open-source GNN modeling libraries prominent in academia like PyTorch Geometric (PyG), while handling scaling and productionization challenges that make it easier for internal practitioners to focus on modeling. GiGL is used in multiple production settings, and has powered over 35 launches across multiple business domains in the last 2 years in the contexts of friend recommendation, content recommendation and advertising. This work details high-level design and tools the library provides, scaling properties, case studies in diverse business settings with industry-scale graphs, and several key lessons learned in employing graph ML at scale on large social data. GiGL is open-sourced at https://github.com/snap-research/GiGL.
- Abstract(参考訳): グラフ機械学習(ML)の最近の進歩は、グラフニューラルネットワーク(GNN)の導入によって、これらのアプローチを大規模ビジネスアプリケーションに適用することへの関心が広まっている。
GNNは、一般的なノード、エッジ(リンク)、グラフレベルのタスクへの最適化を可能にするグラフ構造が与えられたモデルパラメータの微分可能なエンドツーエンド(E2E)学習を可能にする。
新しいGNN層とトレーニング戦略における研究の革新は急速に進んでいるが、大規模グラフMLが生み出すユニークな課題により、GNNの産業的採用と実用性は大きく低下している。
この研究では、SnapchatにおけるGNNのトレーニング、推論、利用に関するアプローチを共有します。
この目的のために,大規模な分散グラフMLを実現するオープンソースライブラリであるGiGL(Gigantic Graph Learning)を紹介した。
私たちはSnapchat社内でGiGLを使用して、リレーショナルDBからのグラフデータ前処理、サブグラフサンプリング、分散トレーニング、推論、オーケストレーションなど、GNNワークフローの重い処理を管理しています。
GiGLは、PyTorch Geometric (PyG)のようなアカデミックで著名なオープンソースのGNNモデリングライブラリと、内部の実践者がモデリングに集中しやすくするスケーリングと本番化の課題に対処して、クリーンにインターフェースするように設計されている。
GiGLは複数のプロダクション環境で利用されており、友人の推薦、コンテンツレコメンデーション、広告の文脈で過去2年間に35以上のビジネスドメインで利用されてきた。
この作業では、ライブラリが提供する高レベルの設計とツール、プロパティのスケーリング、産業規模のグラフを用いた多様なビジネス環境におけるケーススタディ、大規模ソーシャルデータにグラフMLを大規模に採用する上で学んだいくつかの重要な教訓について詳述する。
GiGLはhttps://github.com/snap-research/GiGLでオープンソース化されている。
関連論文リスト
- Large Language Models Meet Graph Neural Networks: A Perspective of Graph Mining [2.8843412675137343]
本稿では,この学際分野の研究のための新しい分類法を提案する。GNN-driving-LLM,GNN-driving-GNN,GNN-LLM-drivingの3つの主要なカテゴリを含む。
大規模言語モデルはグラフ構造化データを扱う大きな可能性を示しているが、高い計算要求と複雑さは依然として課題である。
論文 参考訳(メタデータ) (2024-12-26T13:21:09Z) - All Against Some: Efficient Integration of Large Language Models for Message Passing in Graph Neural Networks [51.19110891434727]
事前訓練された知識と強力なセマンティック理解能力を持つ大規模言語モデル(LLM)は、最近、視覚とテキストデータを使用してアプリケーションに恩恵をもたらす顕著な能力を示している。
E-LLaGNNは、グラフから限られたノード数を増やして、グラフ学習のメッセージパッシング手順を強化するオンデマンドLLMサービスを備えたフレームワークである。
論文 参考訳(メタデータ) (2024-07-20T22:09:42Z) - GraphStorm: all-in-one graph machine learning framework for industry applications [75.23076561638348]
GraphStormはスケーラブルなグラフ構築、グラフモデルのトレーニング、推論のためのエンドツーエンドソリューションである。
GraphStormのすべてのコンポーネントは数十億のノードを持つグラフ上で動作でき、コードを変更することなく、モデルのトレーニングと推論を異なるハードウェアにスケールすることができる。
GraphStormは、2023年5月にリリースされて以来、数十億以上の業界アプリケーションで使われ、デプロイされてきた。
論文 参考訳(メタデータ) (2024-06-10T04:56:16Z) - GLISP: A Scalable GNN Learning System by Exploiting Inherent Structural
Properties of Graphs [5.410321469222541]
産業規模グラフのためのサンプリングベースGNN学習システムであるGLISPを提案する。
GLISPは、グラフパーティショナ、グラフサンプリングサービス、グラフ推論エンジンの3つのコアコンポーネントで構成されている。
実験の結果、GLISPはトレーニングと推論タスクのために既存のGNNシステムよりも最大6.53タイム、70.77タイムのスピードアップを達成した。
論文 参考訳(メタデータ) (2024-01-06T02:59:24Z) - LasTGL: An Industrial Framework for Large-Scale Temporal Graph Learning [61.4707298969173]
本稿では,共通時間グラフ学習アルゴリズムの統一的および統一的な実装を統合する産業用フレームワークであるLasTGLを紹介する。
LasTGLは、詳細なチュートリアルとともに、包括的な時間グラフデータセット、TGNNモデル、ユーティリティを提供する。
論文 参考訳(メタデータ) (2023-11-28T08:45:37Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - Graph Ladling: Shockingly Simple Parallel GNN Training without
Intermediate Communication [100.51884192970499]
GNNは、グラフを学習するニューラルネットワークの強力なファミリーである。
GNNのスケーリングは、肥大化または拡大によって、不健康な勾配、過度なスムースメント、情報のスカッシングといった問題に悩まされる。
本稿では,現在のGNNの深層化や拡張ではなく,GNNに適したモデルスープをデータ中心の視点で表現することを提案する。
論文 参考訳(メタデータ) (2023-06-18T03:33:46Z) - CogDL: A Comprehensive Library for Graph Deep Learning [55.694091294633054]
研究者や実践者が実験を行い、メソッドを比較し、簡単かつ効率的にアプリケーションを構築することができるグラフ深層学習ライブラリであるCogDLを紹介します。
CogDLでは,様々なグラフタスクに対するGNNモデルのトレーニングと評価のための統一設計を提案し,既存のグラフ学習ライブラリに固有のものである。
我々はCogDLのための効率的なスパース演算子を開発し、効率性のための最も競争力のあるグラフライブラリとなる。
論文 参考訳(メタデータ) (2021-03-01T12:35:16Z) - Analyzing the Performance of Graph Neural Networks with Pipe Parallelism [2.269587850533721]
ノードやエッジの分類やリンクの予測といったタスクで大きな成功を収めたグラフニューラルネットワーク(GNN)に注目した。
グラフ技術の進歩には,大規模ネットワーク処理のための新たなアプローチが必要である。
私たちは、ディープラーニングコミュニティで成功したと知られている既存のツールとフレームワークを使用して、GNNを並列化する方法を研究します。
論文 参考訳(メタデータ) (2020-12-20T04:20:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。