論文の概要: Beyond ReAct: A Planner-Centric Framework for Complex Tool-Augmented LLM Reasoning
- arxiv url: http://arxiv.org/abs/2511.10037v1
- Date: Fri, 14 Nov 2025 01:27:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.655751
- Title: Beyond ReAct: A Planner-Centric Framework for Complex Tool-Augmented LLM Reasoning
- Title(参考訳): Beyond ReAct: 複雑なツール強化LLM推論のためのプランナー中心フレームワーク
- Authors: Xiaolong Wei, Yuehu Dong, Xingliang Wang, Xingyu Zhang, Zhejun Zhao, Dongdong Shen, Long Xia, Dawei Yin,
- Abstract要約: そこで我々は,局所最適化ボトルネックを解決するために,プランナー中心のPlan-Executeパラダイムを提案する。
新しいプランナーモデルでは、複雑なクエリのためのグローバル指向非巡回グラフ(DAG)計画を実行する。
複雑なクエリを特徴とする大規模ベンチマークデータセットである ComplexTool-Plan も紹介する。
有能なエグゼキュータと統合すると、我々のフレームワークは複雑なユーザクエリのためのStableToolBenchベンチマークで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 31.679428422518082
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing tool-augmented large language models (LLMs) encounter significant challenges when processing complex queries. Current frameworks such as ReAct are prone to local optimization traps due to their reliance on incremental decision-making processes. To address these limitations, we propose a novel Planner-centric Plan-Execute paradigm that fundamentally resolves local optimization bottlenecks through architectural innovation. Central to our approach is a novel Planner model that performs global Directed Acyclic Graph (DAG) planning for complex queries, enabling optimized execution beyond conventional tool coordination. We also introduce ComplexTool-Plan, a large-scale benchmark dataset featuring complex queries that demand sophisticated multi-tool composition and coordination capabilities. Additionally, we develop a two-stage training methodology that integrates Supervised Fine-Tuning (SFT) with Group Relative Policy Optimization (GRPO), systematically enhancing the Planner's tool selection accuracy and global planning awareness through structured DAG-based planning. When integrated with a capable executor, our framework achieves state-of-the-art performance on the StableToolBench benchmark for complex user queries, demonstrating superior end-to-end execution capabilities and robust handling of intricate multi-tool workflows.
- Abstract(参考訳): 既存のツール拡張大型言語モデル(LLM)は、複雑なクエリを処理する際に重大な課題に直面する。
ReActのような現在のフレームワークは、漸進的な意思決定プロセスに依存しているため、局所最適化の罠になりがちである。
これらの制約に対処するために,アーキテクチャの革新を通じて局所最適化ボトルネックを根本的に解決する,プランナー中心のプラン-エクユートパラダイムを提案する。
我々のアプローチの中心は、複雑なクエリに対してグローバルな指向非巡回グラフ(DAG)計画を実行する新しいプランナーモデルであり、従来のツールコーディネート以上の最適化された実行を可能にします。
また、複雑なクエリを特徴とする大規模ベンチマークデータセットであるComplexTool-Planを導入し、高度なマルチツール合成とコーディネーション機能を要求する。
さらに,スーパービジョンファインチューニング(SFT)とグループ相対政策最適化(GRPO)を統合した2段階のトレーニング手法を開発し,構造化DAGベースの計画を通じて,プランナーのツール選択精度とグローバルな計画意識を体系的に向上させる。
有能なエグゼキュータと統合すると、複雑なユーザクエリのためのStableToolBenchベンチマークで最先端のパフォーマンスを実現し、優れたエンドツーエンド実行能力と複雑なマルチツールワークフローの堅牢なハンドリングを実証する。
関連論文リスト
- GAP: Graph-Based Agent Planning with Parallel Tool Use and Reinforcement Learning [20.75113227786218]
グラフベースのエージェント計画(GAP)は、グラフベースの計画を通じてタスク間の依存関係を明示的にモデル化する新しいフレームワークである。
我々のアプローチは、複雑なタスクを依存性を意識したサブタスクグラフに分解する基礎モデルを訓練する。
この依存性を意識したオーケストレーションは、実行効率とタスクの正確性の両方で大幅に改善される。
論文 参考訳(メタデータ) (2025-10-29T09:35:55Z) - PLAN-TUNING: Post-Training Language Models to Learn Step-by-Step Planning for Complex Problem Solving [66.42260489147617]
大規模言語モデルから合成タスク分解を蒸留するフレームワークであるPLAN-TUNINGを紹介する。
複雑な推論を改善するために、教師付きおよび強化学習の目的を通したプランチューン細管モデル。
本分析は,計画軌道が複雑な推論能力をいかに改善するかを示す。
論文 参考訳(メタデータ) (2025-07-10T07:30:44Z) - HyperTree Planning: Enhancing LLM Reasoning via Hierarchical Thinking [109.09735490692202]
提案するHyperTree Planning(HTP)は,高木構造プランニングアウトラインを構成する新しい推論パラダイムである。
実験ではHTPの有効性を実証し、Gemini-1.5-ProによるTravelPlannerベンチマークで最先端の精度を実現し、o1-previewよりも3.6倍の性能向上を実現した。
論文 参考訳(メタデータ) (2025-05-05T02:38:58Z) - Hierarchical Planning for Complex Tasks with Knowledge Graph-RAG and Symbolic Verification [5.727096041675994]
大型言語モデル(LLM)はロボットプランナーとして約束されているが、長い水平と複雑なタスクでしばしば苦労している。
本稿では,階層的計画生成のための知識グラフに基づくRAGを用いて,LLMベースのプランナを強化するニューロシンボリックアプローチを提案する。
論文 参考訳(メタデータ) (2025-04-06T18:36:30Z) - PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving [89.60370366013142]
制約,検証,選択という3つの重要な要素を持つモデルに依存しない,スケーラブルなエージェントフレームワークであるPlanGENを提案する。
具体的には、推論時間アルゴリズムの性能を向上させるために、制約誘導反復検証を提案する。
論文 参考訳(メタデータ) (2025-02-22T06:21:56Z) - CogPlanner: Unveiling the Potential of Agentic Multimodal Retrieval Augmented Generation with Planning [9.027579000292441]
Multimodal Retrieval Augmented Generation(MRAG)システムは、MLLM(Multimodal Large Language Model)の生成能力を高めることを約束している。
既存のMRAGフレームワークは主に、情報取得とクエリ再構成の現実的な課題に対処できない厳格で単一ステップの検索戦略に準拠している。
本稿では,計算オーバーヘッドを最小限に抑えつつ,効果的な情報探索と統合を目的としたMRAG計画(Multimodal Retrieval Augmented Generation Planning)の課題を紹介する。
論文 参考訳(メタデータ) (2025-01-26T10:16:42Z) - Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.76546523689113]
CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。
CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文 参考訳(メタデータ) (2024-09-19T04:13:58Z) - Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios [93.68764280953624]
UltraToolは、ツール利用におけるLarge Language Modelsの能力を改善し評価するために設計された、新しいベンチマークである。
現実の複雑さを強調し、効果的な問題解決のために正確で多段階の計画を必要とする。
UltraToolの重要な特徴は、ツールの使用前に発生する自然言語による計画の独立した評価である。
論文 参考訳(メタデータ) (2024-01-30T16:52:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。