論文の概要: GRAFT: Graph-Tokenized LLMs for Tool Planning
- arxiv url: http://arxiv.org/abs/2605.11706v1
- Date: Tue, 12 May 2026 07:59:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.685486
- Title: GRAFT: Graph-Tokenized LLMs for Tool Planning
- Title(参考訳): GRAFT:ツールプランニングのためのグラフィカルなLLM
- Authors: Xinyi Gao, Xinyu Ren, Junliang Yu, Tong Chen, Quoc Viet Hung Nguyen, Hongzhi Yin,
- Abstract要約: 大規模言語モデル(LLM)は、複数のステップで外部ツールを選択し調整することで、複雑なタスクを完了させるのにますます使われています。
これにより、ツール間の方向性の実行依存関係を満足しながら、サブタスクインテントとツールの選択を整合させる必要がある。
本稿では,依存認識ツール計画のためのグラフ学習言語モデルフレームワークであるGRAFTを提案する。
- 参考スコア(独自算出の注目度): 41.72670983284452
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) are increasingly used to complete complex tasks by selecting and coordinating external tools across multiple steps. This requires aligning tool choices with subtask intent while satisfying directional execution dependencies among tools. To do this, existing methods model these dependencies as tool graphs and incorporate the graphs with LLMs through retrieval, serialization, or prompt-level injection. However, these external graph-use strategies all follow a matching paradigm, which often fails to align tool choices with the underlying subtask structure, producing semantically plausible plans that violate graph constraints. This issue is further exacerbated by error accumulation, where an early incorrect tool selection shifts the plan into an invalid graph state and causes subsequent predictions to drift away from the valid execution path. To address these challenges, we propose GRAFT, a graph-tokenized language model framework for dependency-aware tool planning. GRAFT internalizes the tool graph by mapping each tool node to a dedicated special token and learning directed tool dependencies within the representation space. It further introduces on-policy tool context distillation, training the model on its own sampled trajectories while distilling stepwise planning signals. Experiments show that GRAFT achieves state-of-the-art performance in exact sequence matching and dependency legality, supporting more reliable LLM tool planning in complex workflows.
- Abstract(参考訳): 大規模言語モデル(LLM)は、複数のステップで外部ツールを選択し調整することで、複雑なタスクを完了させるのにますます使われています。
これにより、ツール間の方向性の実行依存関係を満足しながら、サブタスクインテントとツールの選択を整合させる必要がある。
これを実現するために、既存のメソッドは、これらの依存関係をツールグラフとしてモデル化し、検索、シリアライゼーション、即時レベルのインジェクションを通じてLLMにグラフを組み込む。
しかし、これらのグラフ利用戦略はすべて一致するパラダイムに従い、ツールの選択を下層のサブタスク構造と整合させることがしばしば失敗し、グラフ制約に反する意味論的に妥当な計画を生成する。
この問題はエラーの蓄積によってさらに悪化し、初期不正確なツール選択によって計画が無効なグラフ状態に移行し、その後の予測が有効な実行パスから逸脱する原因となる。
これらの課題に対処するため,依存認識ツール計画のためのグラフ対応言語モデルフレームワークであるGRAFTを提案する。
GRAFTはツールノードを専用の特別なトークンにマッピングしてツールグラフを内部化し、表現空間内でツール依存を学習する。
さらに、オンラインツールの文脈蒸留を導入し、段階的に計画する信号を蒸留しながら、独自のサンプル軌道でモデルを訓練する。
実験により、GRAFTは、複雑なワークフローにおいてより信頼性の高いLCMツール計画をサポートし、精度の高いシーケンスマッチングと依存性の合法性で最先端のパフォーマンスを達成することが示された。
関連論文リスト
- SIT-Graph: State Integrated Tool Graph for Multi-Turn Agents [35.85800795225018]
State Integrated Tool Graph (SIT-Graph)は、エピソードとプロシージャメモリを統合した人間の意思決定にインスパイアされている。
推論時に、SIT-Graphは、エピソード的リコールと手続き的実行の間の人間のようなバランスを可能にする。
複数のステートフルなマルチターンツール使用ベンチマークによる実験は、SIT-Graphが強いメモリベースとグラフベースのベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-12-08T08:27:24Z) - GAP: Graph-Based Agent Planning with Parallel Tool Use and Reinforcement Learning [20.75113227786218]
グラフベースのエージェント計画(GAP)は、グラフベースの計画を通じてタスク間の依存関係を明示的にモデル化する新しいフレームワークである。
我々のアプローチは、複雑なタスクを依存性を意識したサブタスクグラフに分解する基礎モデルを訓練する。
この依存性を意識したオーケストレーションは、実行効率とタスクの正確性の両方で大幅に改善される。
論文 参考訳(メタデータ) (2025-10-29T09:35:55Z) - GTool: Graph Enhanced Tool Planning with Large Language Model [20.584869026691695]
非完全依存関係下での大規模言語モデル(LLM)のツール計画能力を高めるために,textttGToolを提案する。
textttGToolは、リクエスト固有のツールグラフを構築し、ツールを効率的に選択し、十分な依存情報を提供する textttgraph token> を生成する。
大規模な実験により、textttGToolは最先端(SOTA)ベースラインと比較して29.6%以上のパフォーマンス改善が達成された。
論文 参考訳(メタデータ) (2025-08-18T08:46:55Z) - Plan-over-Graph: Towards Parallelable LLM Agent Schedule [53.834646147919436]
大規模言語モデル(LLM)はタスク計画の推論において例外的な能力を示した。
本稿では,まず実生活のテキストタスクを実行可能なサブタスクに分解し,抽象的なタスクグラフを構築する,新しいパラダイムであるプランオーバーグラフを提案する。
モデルはこのタスクグラフを入力として理解し、並列実行計画を生成する。
論文 参考訳(メタデータ) (2025-02-20T13:47:51Z) - Towards Completeness-Oriented Tool Retrieval for Large Language Models [60.733557487886635]
現実世界のシステムは多種多様なツールを組み込んでおり、全てのツールを大規模言語モデルに入力することは不可能である。
既存のツール検索手法は主にユーザクエリとツール記述間のセマンティックマッチングに焦点を当てている。
我々は,ユーザクエリとツール記述のセマンティックな類似性だけでなく,ツールの協調的情報も考慮した,新しいモデル診断型協調学習型ツール検索手法であるCOLTを提案する。
論文 参考訳(メタデータ) (2024-05-25T06:41:23Z) - ToolNet: Connecting Large Language Models with Massive Tools via Tool
Graph [43.95759808077083]
既存のテキスト内学習アプローチは、ツールを単純なテキスト記述のリストにフォーマットし、大きな言語モデルに入力する。
本稿では,トークン消費を適度に増加させ,ツールの数を数千にスケールアップするプラグイン・アンド・プレイ・フレームワークであるToolNetを提案する。
論文 参考訳(メタデータ) (2024-02-29T02:04:00Z) - ControlLLM: Augment Language Models with Tools by Searching on Graphs [97.62758830255002]
我々は,大規模言語モデル(LLM)が実世界のタスクを解くためのマルチモーダルツールを利用できる新しいフレームワークであるControlLLMを提案する。
フレームワークは,(1)複雑なタスクを明確なサブタスクに分割し,入力と出力を適切に定義したサブタスクに分解するtextittask Decomposer,(2)構築済みのツールグラフ上で最適なソリューションパスを探索する textitThoughts-on-Graph(ToG)パラダイム,(3)ソリューションパスを解釈して実行するリッチなツールボックスを備えた textitexecution Engine,の3つの主要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-10-26T21:57:21Z) - Structural Embeddings of Tools for Large Language Models [0.0]
LLM(Large Language Models)の現在の状況は、外部ツールの組み入れを必要とすることは明らかである。
特定のタスクに対するツール利用のオントロジ的性質は、DAG(Directed Acyclic Graph)でうまく定式化できる。
LLMによる指数関数的に増加する外部ツールのオーケストレーションを導くための模範的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-01T10:46:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。