論文の概要: GRADE: Graph Representation of LLM Agent Dependency and Execution
- arxiv url: http://arxiv.org/abs/2606.22741v1
- Date: Mon, 22 Jun 2026 01:03:21 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-24 20:32:28.896289
- Title: GRADE: Graph Representation of LLM Agent Dependency and Execution
- Title(参考訳): GRADE: LLMエージェント依存と実行のグラフ表現
- Authors: Yue Zhao,
- Abstract要約: GRADEは、その欠落したレイヤを回復する: ステップノード上の任意の実行を1つのグラフとしてモデル化する。
依存関係層は、実行サイズが弱い障害を予測することができる。
実行層は、失敗したマルチエージェント実行における障害ステップをローカライズする。
- 参考スコア(独自算出の注目度): 6.230697997280125
- License:
- Abstract: Can one graph represent every kind of LLM agent's run? A trace records what each step did, never what it relied on, the state it read, and the results it reused. GRADE recovers that missing layer: it models any run as one graph over its step nodes with two edge layers, execution edges (what ran in what order) read from the trace for free, and dependency edges (what each step relied on) rarely logged, so each is graded by how it is known, observed, declared, or inferred. One representation, and each layer earns its place. Across six corpora of LLM agents spanning tool use, coding, and the web, the dependency layer can predict failure where run size is weak and, under leave-one-corpus-out transfer, stays above chance on every held-out class while run size fails. Meanwhile, the execution layer localizes the faulting step in a failed multi-agent run. This work also provides a more in-depth analysis of why generic graph neural networks may misread the dependency layer, unlike our feature-based alternative. The same graph representation opens further uses, carrying from failure diagnosis in a single run to efficiency and robustness optimization at scale.
- Abstract(参考訳): 1つのグラフは、全ての LLM エージェントの実行を表現できますか?
トレースは、各ステップが何をしたか、何を頼ったか、読んだ状態、そして再利用した結果を記録します。
GRADEは、すべての実行をステップノード上の1つのグラフとしてモデル化し、2つのエッジ層で、実行エッジ(どの順序で実行されたか)がトレースから自由に読み取られ、依存関係エッジ(各ステップが依存したもの)がログに記録されることが滅多にないため、各実行は、その既知の、観察された、宣言された、推測された方法によって評価される。
1つの表現と各レイヤがその場所を得る。
ツールの使用、コーディング、Webにまたがる6つのLLMエージェントのコーパスにまたがって、依存性レイヤは、実行サイズが弱く、残り1コーパスアウト転送の下では、実行サイズが失敗する間、すべてのホールトアウトクラスにチャンスを保ちます。
一方、実行層は、失敗したマルチエージェント実行における障害ステップをローカライズする。
この研究は、ジェネリックグラフニューラルネットワークが、機能ベースの代替手段とは異なり、依存層を誤って読み取る可能性がある理由について、より詳細な分析も提供する。
同じグラフ表現は、単一実行時の障害診断から、効率性と大規模なロバストネスの最適化に至るまで、さらなる用途に開放される。
関連論文リスト
- GraphInfer-Bench: Benchmarking LLM's Inference Capability on Graphs [21.80259191908136]
GraphInfer-Benchは、グラフ推論のためのベンチマークであり、単一のノードがサポートせず、パスが取得されない、オープンな回答を生成する。
既存のGraph-QAプロトコルでは、アルゴリズムシミュレーション、ノード分類、単一ノード記述、KG-QA、GraphRAGはすべて、あるノードまたはパスに沿って検索可能な回答を認めている。
リリースには6つの実世界のグラフにまたがる42,000のサンプルが含まれている。
論文 参考訳(メタデータ) (2026-06-10T01:41:53Z) - GraphARC: A Comprehensive Benchmark for Graph-Based Abstract Reasoning [28.844098517315228]
グラフ構造化データの抽象的推論のためのベンチマークであるGraphARCを紹介する。
各タスクは、新しいテストグラフに適用する少数の入出力ペアから変換ルールを推論する必要がある。
我々はGraphARCの最先端言語モデルを評価し、明確な制限を観察する。
論文 参考訳(メタデータ) (2026-05-29T09:03:30Z) - GraphCogent: Mitigating LLMs' Working Memory Constraints via Multi-Agent Collaboration in Complex Graph Understanding [13.356521655409422]
大規模言語モデル(LLM)は、小規模なグラフ推論タスクでは有望な性能を示すが、複雑なクエリで現実のグラフを扱うと失敗する。
グラフ推論を特殊な認知プロセス(センス、バッファ、実行)に分解する協調エージェントフレームワークであるGraphCogentを提案する。
論文 参考訳(メタデータ) (2025-08-17T14:28:38Z) - Can Large Language Models Analyze Graphs like Professionals? A Benchmark, Datasets and Models [70.03602551880526]
グラフを処理するために,大規模言語モデル(LLM)のベンチマークであるProGraphを導入する。
その結果,現在のLCMの性能は不満足であり,最高のモデルでは36%の精度しか達成できないことがわかった。
本研究では,6つの広く使用されているグラフライブラリに基づいて,クローリングされたドキュメントと自動生成コードを含むLLM4Graphデータセットを提案する。
論文 参考訳(メタデータ) (2024-09-29T11:38:45Z) - Semi-Supervised Hierarchical Graph Classification [54.25165160435073]
ノードがグラフのインスタンスである階層グラフにおけるノード分類問題について検討する。
本稿では階層グラフ相互情報(HGMI)を提案し,理論的保証をもってHGMIを計算する方法を提案する。
本稿では,この階層グラフモデリングとSEAL-CI法がテキストおよびソーシャルネットワークデータに与える影響を実証する。
論文 参考訳(メタデータ) (2022-06-11T04:05:29Z) - Representative Graph Neural Network [113.67254049938629]
いくつかの代表的特徴を動的にサンプリングするために、代表グラフ層を提示する。
すべての位置からメッセージを伝搬する代わりに、RepGraphレイヤは1つのノードの応答を数個の代表ノードで計算します。
論文 参考訳(メタデータ) (2020-08-12T09:46:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。