論文の概要: GraphMaster: Automated Graph Synthesis via LLM Agents in Data-Limited Environments
- arxiv url: http://arxiv.org/abs/2504.00711v1
- Date: Tue, 01 Apr 2025 12:21:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:20:21.598266
- Title: GraphMaster: Automated Graph Synthesis via LLM Agents in Data-Limited Environments
- Title(参考訳): GraphMaster: LLMエージェントによるデータ制限環境におけるグラフ自動生成
- Authors: Enjun Du, Xunkai Li, Tian Jin, Zhihan Zhang, Rong-Hua Li, Guoren Wang,
- Abstract要約: GraphMasterは、データ制限された環境でグラフデータ合成用に特別に設計された最初のマルチエージェントフレームワークである。
我々は6つの標準グラフベンチマークの「サブ」変種を新たに開発し、現実的な制約下での合成能力を試験するために特別に設計した。
また,人間の評価とグラスマン多様体に基づく解析を併用した新しい解釈可能性評価フレームワークを開発した。
- 参考スコア(独自算出の注目度): 32.916371346197835
- License:
- Abstract: The era of foundation models has revolutionized AI research, yet Graph Foundation Models (GFMs) remain constrained by the scarcity of large-scale graph corpora. Traditional graph data synthesis techniques primarily focus on simplistic structural operations, lacking the capacity to generate semantically rich nodes with meaningful textual attributes: a critical limitation for real-world applications. While large language models (LLMs) demonstrate exceptional text generation capabilities, their direct application to graph synthesis is impeded by context window limitations, hallucination phenomena, and structural consistency challenges. To address these issues, we introduce GraphMaster, the first multi-agent framework specifically designed for graph data synthesis in data-limited environments. GraphMaster orchestrates four specialized LLM agents (Manager, Perception, Enhancement, and Evaluation) that collaboratively optimize the synthesis process through iterative refinement, ensuring both semantic coherence and structural integrity. To rigorously evaluate our approach, we create new data-limited "Sub" variants of six standard graph benchmarks, specifically designed to test synthesis capabilities under realistic constraints. Additionally, we develop a novel interpretability assessment framework that combines human evaluation with a principled Grassmannian manifold-based analysis, providing both qualitative and quantitative measures of semantic coherence. Experimental results demonstrate that GraphMaster significantly outperforms traditional synthesis methods across multiple datasets, establishing a strong foundation for advancing GFMs in data-scarce environments.
- Abstract(参考訳): 基礎モデルの時代はAI研究に革命をもたらしたが、グラフ基礎モデル(GFM)は大規模なグラフコーパスの不足によって制約を受け続けている。
従来のグラフデータ合成技術は主に単純化された構造演算に重点を置いており、意味のあるテキスト属性を持つ意味的にリッチなノードを生成する能力が欠如している。
大規模言語モデル(LLM)は、例外的なテキスト生成能力を示すが、グラフ合成への直接的な適用は、コンテキストウィンドウの制限、幻覚現象、構造的一貫性の問題によって妨げられる。
このような問題に対処するために,データ限定環境におけるグラフデータ合成に特化した,最初のマルチエージェントフレームワークであるGraphMasterを紹介した。
GraphMasterは4つの特殊なLLMエージェント(Manager, Perception, Enhancement, and Evaluation)を編成し、反復的洗練を通じて合成プロセスを協調的に最適化し、セマンティックコヒーレンスと構造的整合性を確保する。
提案手法を厳格に評価するため、6つの標準グラフベンチマークの「サブ」変種を新たに作成し、具体的には現実的な制約下で合成機能をテストするように設計された。
さらに,人間の評価を基本的グラスマン多様体解析と組み合わせた新しい解釈可能性評価フレームワークを開発し,意味的コヒーレンスを定性的かつ定量的に測定する。
実験の結果、GraphMasterは複数のデータセット間で従来の合成方法よりも大幅に優れており、データスカース環境でのGFMの進歩のための強力な基盤を確立している。
関連論文リスト
- Revisiting Graph Neural Networks on Graph-level Tasks: Comprehensive Experiments, Analysis, and Improvements [54.006506479865344]
グラフレベルグラフニューラルネットワーク(GNN)のための統一評価フレームワークを提案する。
このフレームワークは、さまざまなデータセットにわたるGNNを評価するための標準化された設定を提供する。
また,表現性の向上と一般化機能を備えた新しいGNNモデルを提案する。
論文 参考訳(メタデータ) (2025-01-01T08:48:53Z) - Graph Learning in the Era of LLMs: A Survey from the Perspective of Data, Models, and Tasks [25.720233631885726]
グラフニューラルネットワーク(GNN)とLarge Language Models(LLM)の統合は、有望な技術パラダイムとして現れている。
データ品質を根本的に向上させるために、リッチなセマンティックコンテキストを持つグラフ記述テキストを活用します。
この研究は、グラフ学習方法論の進歩を目指す研究者や実践者にとって、基礎的な参考となる。
論文 参考訳(メタデータ) (2024-12-17T01:41:17Z) - Towards Graph Foundation Models: A Study on the Generalization of Positional and Structural Encodings [36.58861528662219]
位置的および構造的符号化(PSE)がグラフニューラルネットワーク(GNN)に統合された
本稿では,様々なグラフデータセット間での学習可能なPSEの微調整効率,サンプルサイズによるスケーラビリティ,一般化,能力について検討する。
論文 参考訳(メタデータ) (2024-12-10T10:58:47Z) - LLM-Based Multi-Agent Systems are Scalable Graph Generative Models [73.28294528654885]
GraphAgent-Generator (GAG) は動的でテキスト対応のソーシャルグラフ生成のための新しいシミュレーションベースのフレームワークである。
GAGは、ゼロショットソーシャルグラフ生成のための時間ノードとエッジ生成プロセスをシミュレートする。
得られたグラフは7つの主要なマクロ的ネットワーク特性に付着し、微視的グラフ構造測定において11%の改善が達成される。
論文 参考訳(メタデータ) (2024-10-13T12:57:08Z) - How Do Large Language Models Understand Graph Patterns? A Benchmark for Graph Pattern Comprehension [53.6373473053431]
この研究は、グラフパターンタスクにおける大規模言語モデルの能力を評価するためのベンチマークを導入する。
我々は,LLMが用語的記述と位相的記述の両方に基づいて,グラフパターンを理解できるかどうかを評価するベンチマークを開発した。
私たちのベンチマークでは、合成データセットと実際のデータセットの両方と、11のタスクと7のモデルで構成されています。
論文 参考訳(メタデータ) (2024-10-04T04:48:33Z) - MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。
2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。
タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - A Pure Transformer Pretraining Framework on Text-attributed Graphs [50.833130854272774]
グラフ構造を先行として扱うことで,特徴中心の事前学習の視点を導入する。
我々のフレームワークであるGraph Sequence Pretraining with Transformer (GSPT)はランダムウォークを通してノードコンテキストをサンプリングする。
GSPTはノード分類とリンク予測の両方に容易に適応でき、様々なデータセットで有望な経験的成功を示す。
論文 参考訳(メタデータ) (2024-06-19T22:30:08Z) - SynHING: Synthetic Heterogeneous Information Network Generation for Graph Learning and Explanation [31.89877722246351]
合成不均一情報ネットワーク生成のための新しいフレームワークであるSynHingを紹介する。
SynHingは、ターゲットHINの主要なモチーフを体系的に識別し、クラスタ内およびクラスタ間マージモジュールによるボトムアップ生成プロセスを使用する。
GNN説明器モデルを評価するための基礎的なモチーフを提供し、説明可能な合成HIN生成のための新しい標準を設定する。
論文 参考訳(メタデータ) (2024-01-07T04:43:36Z) - The Devil in the Details: Simple and Effective Optical Flow Synthetic
Data Generation [19.945859289278534]
本稿では,光学フローデータセットの要求特性が比較的単純であり,簡易な合成データ生成法を提案する。
2次元動きに基づくデータセットでは、合成データセットを生成するための最も単純だが重要な要素を体系的に分析する。
論文 参考訳(メタデータ) (2023-08-14T18:01:45Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。