論文の概要: Enhancing LLM-Based Agents via Global Planning and Hierarchical Execution
- arxiv url: http://arxiv.org/abs/2504.16563v3
- Date: Tue, 29 Apr 2025 13:30:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.06974
- Title: Enhancing LLM-Based Agents via Global Planning and Hierarchical Execution
- Title(参考訳): グローバルプランニングと階層的実行によるLCMエージェントの強化
- Authors: Junjie Chen, Haitao Li, Jingli Yang, Yiqun Liu, Qingyao Ai,
- Abstract要約: GoalActは、継続的に更新されるグローバルな計画メカニズムを導入し、階層的な実行戦略を統合する新しいエージェントフレームワークである。
GoalActはタスク実行を、検索、コーディング、書き込みなどを含む高度なスキルに分解する。
われわれはGoalAct on LegalAgentBenchの評価を行った。
- 参考スコア(独自算出の注目度): 18.68431625184045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent agent systems based on Large Language Models (LLMs) have shown great potential in real-world applications. However, existing agent frameworks still face critical limitations in task planning and execution, restricting their effectiveness and generalizability. Specifically, current planning methods often lack clear global goals, leading agents to get stuck in local branches, or produce non-executable plans. Meanwhile, existing execution mechanisms struggle to balance complexity and stability, and their limited action space restricts their ability to handle diverse real-world tasks. To address these limitations, we propose GoalAct, a novel agent framework that introduces a continuously updated global planning mechanism and integrates a hierarchical execution strategy. GoalAct decomposes task execution into high-level skills, including searching, coding, writing and more, thereby reducing planning complexity while enhancing the agents' adaptability across diverse task scenarios. We evaluate GoalAct on LegalAgentBench, a benchmark with multiple types of legal tasks that require the use of multiple types of tools. Experimental results demonstrate that GoalAct achieves state-of-the-art (SOTA) performance, with an average improvement of 12.22% in success rate. These findings highlight GoalAct's potential to drive the development of more advanced intelligent agent systems, making them more effective across complex real-world applications. Our code can be found at https://github.com/cjj826/GoalAct.
- Abstract(参考訳): LLM(Large Language Models)に基づくインテリジェントエージェントシステムは,実世界のアプリケーションにおいて大きな可能性を秘めている。
しかし、既存のエージェントフレームワークは依然としてタスク計画と実行において重要な制限に直面しており、その有効性と一般化性は制限されている。
特に、現在の計画手法では、明確なグローバルな目標が欠如しており、エージェントがローカルブランチで立ち往生したり、実行不可能な計画を作成したりする。
一方、既存の実行メカニズムは複雑さと安定性のバランスをとるのに苦労しており、その限られたアクション空間は、様々な現実世界のタスクを扱う能力を制限する。
このような制約に対処するために,継続的なグローバル計画機構を導入し,階層的な実行戦略を統合する新しいエージェントフレームワークであるGoalActを提案する。
GoalActはタスク実行を検索、コーディング、書き込みなどの高度なスキルに分解することで、さまざまなタスクシナリオにまたがるエージェントの適応性を高めながら、計画上の複雑さを低減します。
われわれはGoalAct on LegalAgentBenchの評価を行った。
実験の結果、GoalActは平均12.22%の成功率で最先端(SOTA)のパフォーマンスを達成した。
これらの知見は、GoalActがより高度なインテリジェントエージェントシステムの開発を推進し、複雑な現実世界のアプリケーションにまたがってより効果的になる可能性を浮き彫りにしている。
私たちのコードはhttps://github.com/cjj826/GoalAct.orgにある。
関連論文リスト
- AppAgentX: Evolving GUI Agents as Proficient Smartphone Users [34.70342284525283]
本稿では,インテリジェンスと柔軟性を維持しつつ,操作効率を向上させるGUIエージェントの進化的フレームワークを提案する。
本手法は,エージェントのタスク実行履歴を記録するメモリ機構を組み込んだものである。
複数のベンチマークタスクに対する実験結果から,本手法は既存の手法よりも効率と精度が優れていることが示された。
論文 参考訳(メタデータ) (2025-03-04T04:34:09Z) - PoAct: Policy and Action Dual-Control Agent for Generalized Applications [18.342339678035685]
本稿では、汎用アプリケーションのためのポリシーとアクションデュアル・コントロル・エージェント(PoAct)を提案する。
PoActは、推論ポリシーを動的に切り替え、アクション空間を変更することで、高品質なコードアクションとより正確な推論パスを達成することを目指している。
論文 参考訳(メタデータ) (2025-01-13T04:28:40Z) - MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [52.739500459903724]
大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。
特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。
長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文 参考訳(メタデータ) (2024-11-26T17:53:44Z) - Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
マルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークであるAOPを提案する。
本研究では, エージェント指向計画の3つの重要な設計原則, 可解性, 完全性, 非冗長性を明らかにする。
大規模実験は,マルチエージェントシステムにおける単一エージェントシステムと既存の計画戦略と比較して,現実の問題を解決する上でのAOPの進歩を実証している。
論文 参考訳(メタデータ) (2024-10-03T04:07:51Z) - CoAct: A Global-Local Hierarchy for Autonomous Agent Collaboration [87.51781348070914]
既存のLLMは、様々なNLPタスクで顕著なパフォーマンスを示すが、それでも複雑な現実世界タスクに苦戦している。
本稿では,人間社会における階層的計画と協調のパターンをLLMシステムに伝達するCoActフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-19T09:23:53Z) - Ask-before-Plan: Proactive Language Agents for Real-World Planning [68.08024918064503]
プロアクティブエージェントプランニングでは、ユーザエージェントの会話とエージェント環境のインタラクションに基づいて、言語エージェントが明確化のニーズを予測する必要がある。
本稿では,明確化,実行,計画の3つのエージェントからなる新しいマルチエージェントフレームワーク,Clarification-Execution-Planning(textttCEP)を提案する。
論文 参考訳(メタデータ) (2024-06-18T14:07:28Z) - Planning with Multi-Constraints via Collaborative Language Agents [13.550774629515843]
本稿では,協調型マルチエージェントシステムのためのゼロショット手法であるPMC(Planning with Multi-Constraints)を紹介する。
PMCは、制約で複雑なタスク計画を簡単にし、従属タスクの階層に分解する。
PMCはTravelPlannerで平均42.68%の成功率を記録し、GPT-4 (2.92%) をはるかに上回り、API-BankでReActを13.64%上回った。
論文 参考訳(メタデータ) (2024-05-26T10:33:17Z) - KnowAgent: Knowledge-Augmented Planning for LLM-Based Agents [52.34892973785117]
大規模言語モデル(LLM)は複雑な推論タスクにおいて大きな可能性を証明していますが、より高度な課題に取り組むには不十分です。
この不適切さは、主に言語エージェントのアクション知識が組み込まれていないことに起因する。
我々は、明示的な行動知識を取り入れることで、LLMの計画能力を高めるために設計された新しいアプローチであるKnowAgentを紹介する。
論文 参考訳(メタデータ) (2024-03-05T16:39:12Z) - TDAG: A Multi-Agent Framework based on Dynamic Task Decomposition and Agent Generation [41.21899915378596]
動的タスク分解・エージェント生成(TDAG)に基づくマルチエージェントフレームワークを提案する。
このフレームワークは複雑なタスクを小さなサブタスクに動的に分解し、それぞれが特定の生成されたサブエージェントに割り当てる。
ItineraryBenchは、さまざまな複雑さのタスク間でのメモリ、計画、ツール使用量のエージェントの能力を評価するように設計されている。
論文 参考訳(メタデータ) (2024-02-15T18:27:37Z) - Modelling Multi-Agent Epistemic Planning in ASP [66.76082318001976]
本稿では,マルチショット・アンサー・セット・プログラミング・ベース・プランナの実装について述べる。
本稿は, アドホックなエピステミック状態表現とASPソルバの効率を生かしたプランナーが, 文献から収集したベンチマークに対して, 競合的な性能を示すことを示す。
論文 参考訳(メタデータ) (2020-08-07T06:35:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。