論文の概要: Do Agents Need to Plan Step-by-Step? Rethinking Planning Horizon in Data-Centric Tool Calling
- arxiv url: http://arxiv.org/abs/2605.08477v1
- Date: Fri, 08 May 2026 20:51:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.676181
- Title: Do Agents Need to Plan Step-by-Step? Rethinking Planning Horizon in Data-Centric Tool Calling
- Title(参考訳): エージェントはステップバイステップで計画する必要があるか? データ中心のツールコールにおける計画水平の再考
- Authors: Naoki Otani, Nikita Bhutani, Hannah Kim, Dan Zhang, Estevam Hruschka,
- Abstract要約: LLMベースのエージェントは複雑なデータ中心のタスクを解決する。
既存の戦略は,(1)実行前に完全な計画を生成するフルホライズン(FH)と,(2)段階的推論と観察を伴う各アクション(ツールコール)をインターリーブするシングルステップ水平化(SH)の2つのパラダイムに分類される。
- 参考スコア(独自算出の注目度): 18.782893288656044
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Explicit planning is a critical capability for LLM-based agents solving complex data-centric tasks, which require precise tool calling over external data sources. Existing strategies fall into two paradigms based on planning horizon: (1) full-horizon (FH), which generates a complete plan before execution, and (2) single-step horizon (SH), which interleaves each action (tool call) with incremental reasoning and observation. While step-by-step execution is a common default under the assumption that eager execution monitoring is necessary for adaptability, we revisit this assumption for well-defined data-centric tasks. Our controlled empirical study isolates planning horizon as the key architectural feature and systematically analyzes the effects of topological complexity and tool robustness on both paradigms. Our experiments across Knowledge Base Question Answering and Multi-hop QA show that FH planning with lazy replanning achieves accuracy parity with SH across varying depths, breadths, and robustness levels, while using 2-3x fewer tokens. These findings suggest that for well-defined data-centric tasks, eager step-wise monitoring is often unnecessary, and full-horizon planning with on-demand replanning can offer a more efficient default.
- Abstract(参考訳): 明示的なプランニングは、複雑なデータ中心のタスクを解くLLMベースのエージェントにとって重要な機能である。
既存の戦略は,(1)実行前に完全な計画を生成するフルホライズン(FH)と,(2)段階的推論と観察を伴う各アクション(ツールコール)をインターリーブするシングルステップ水平化(SH)の2つのパラダイムに分類される。
ステップバイステップの実行は、適応性に熱心な実行監視が必要であるという前提の下では、一般的なデフォルトですが、明確に定義されたデータ中心のタスクに対して、この仮定を再考します。
制御された実証研究は,計画的地平線を重要な建築的特徴として分離し,トポロジ的複雑性とツールの堅牢性が両パラダイムに与える影響を体系的に解析する。
知識ベース質問回答とマルチホップQAによる実験により,遅延計画によるFH計画が,トークンの2~3倍のトークンを用いて,様々な深さ,幅,頑健性レベルにわたるSHと精度の同等性を実現することが示された。
これらの結果は、明確に定義されたデータ中心のタスクでは、熱心なステップワイド監視は不要であることが多く、オンデマンドのリプランニングによる完全な水平計画の方が、より効率的なデフォルトを提供する可能性があることを示唆している。
関連論文リスト
- HyperTree Planning: Enhancing LLM Reasoning via Hierarchical Thinking [109.09735490692202]
提案するHyperTree Planning(HTP)は,高木構造プランニングアウトラインを構成する新しい推論パラダイムである。
実験ではHTPの有効性を実証し、Gemini-1.5-ProによるTravelPlannerベンチマークで最先端の精度を実現し、o1-previewよりも3.6倍の性能向上を実現した。
論文 参考訳(メタデータ) (2025-05-05T02:38:58Z) - Propose, Assess, Search: Harnessing LLMs for Goal-Oriented Planning in Instructional Videos [48.15438373870542]
VidAssistは、インストラクショナルビデオにおけるゼロ/フェーショット目標指向の計画のために設計された統合フレームワークである。
最適な計画生成のための幅優先探索アルゴリズムを採用している。
実験によると、VidAssistは異なる目標指向の計画設定のための統一されたフレームワークを提供する。
論文 参考訳(メタデータ) (2024-09-30T17:57:28Z) - On The Planning Abilities of OpenAI's o1 Models: Feasibility, Optimality, and Generalizability [59.72892401927283]
さまざまなベンチマークタスクでOpenAIのo1モデルの計画能力を評価する。
その結果,o1-preview は GPT-4 よりもタスク制約に順応していることがわかった。
論文 参考訳(メタデータ) (2024-09-30T03:58:43Z) - Long-horizon Embodied Planning with Implicit Logical Inference and Hallucination Mitigation [7.668848364013772]
本稿では,RelePについて紹介する。
ReLEPは、微調整を通じて暗黙的な論理的推論を学習することで、コンテキスト内の例を使わずに、幅広い長距離タスクを完了することができる。
論文 参考訳(メタデータ) (2024-09-24T01:47:23Z) - Socratic Planner: Self-QA-Based Zero-Shot Planning for Embodied Instruction Following [17.608330952846075]
EIF(Embodied Instruction following)は、対話型環境でオブジェクトをナビゲートし、対話することによって自然言語命令を実行するタスクである。
EIFにおける重要な課題は、典型的には教師付き学習やラベル付きデータによる少数ショットのインコンテキスト学習を通じて対処される構成的タスク計画である。
本稿では,自己QAに基づくゼロショット計画手法であるソクラティック・プランナーを紹介する。
論文 参考訳(メタデータ) (2024-04-21T08:10:20Z) - Parting with Misconceptions about Learning-based Vehicle Motion Planning [30.39229175273061]
nuPlanは、自動車の運動計画研究の新しい時代を象徴している。
既存のシステムは、両方の要件を同時に満たすのに苦労しています。
本稿では,非常にシンプルで効率的なプランナを提案する。
論文 参考訳(メタデータ) (2023-06-13T17:57:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。