論文の概要: BAR: A Backward Reasoning based Agent for Complex Minecraft Tasks
- arxiv url: http://arxiv.org/abs/2505.14079v1
- Date: Tue, 20 May 2025 08:35:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.93374
- Title: BAR: A Backward Reasoning based Agent for Complex Minecraft Tasks
- Title(参考訳): BAR:複雑なMinecraftタスクのための後方推論ベースのエージェント
- Authors: Weihong Du, Wenrui Liao, Binyu Yan, Hongru Liang, Anthony G. Cohn, Wenqiang Lei,
- Abstract要約: タスクを完了するには、LLM(Big Language Model)ベースのエージェントを計画によって簡単に実行可能なステップに分解する必要がある。
既存の研究は主にエージェントの初期状態から次にどのステップを実行するべきかを推測することで計画を実行する。
実世界のシナリオに基づいて複雑なタスクをシミュレートする仮想環境であるMinecraftでこの問題を研究することを提案する。
- 参考スコア(独自算出の注目度): 15.48158268901061
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language model (LLM) based agents have shown great potential in following human instructions and automatically completing various tasks. To complete a task, the agent needs to decompose it into easily executed steps by planning. Existing studies mainly conduct the planning by inferring what steps should be executed next starting from the agent's initial state. However, this forward reasoning paradigm doesn't work well for complex tasks. We propose to study this issue in Minecraft, a virtual environment that simulates complex tasks based on real-world scenarios. We believe that the failure of forward reasoning is caused by the big perception gap between the agent's initial state and task goal. To this end, we leverage backward reasoning and make the planning starting from the terminal state, which can directly achieve the task goal in one step. Specifically, we design a BAckward Reasoning based agent (BAR). It is equipped with a recursive goal decomposition module, a state consistency maintaining module and a stage memory module to make robust, consistent, and efficient planning starting from the terminal state. Experimental results demonstrate the superiority of BAR over existing methods and the effectiveness of proposed modules.
- Abstract(参考訳): 大規模言語モデル(LLM)に基づくエージェントは、人間の指示に従い、様々なタスクを自動的に完了させる大きな可能性を示している。
タスクを完了するには、エージェントはそれを計画によって簡単に実行されたステップに分解する必要がある。
既存の研究は主にエージェントの初期状態から次にどのステップを実行するべきかを推測することで計画を実行する。
しかし、この前方推論パラダイムは複雑なタスクではうまくいきません。
実世界のシナリオに基づいて複雑なタスクをシミュレートする仮想環境であるMinecraftでこの問題を研究することを提案する。
フォワード推論の失敗は,エージェントの初期状態とタスク目標との間の大きな認識ギャップによって引き起こされると考えている。
この目的のために、後方推論を活用し、端末状態からプランニングをスタートさせ、1ステップでタスク目標を直接達成できる。
具体的には,BAckward Reasoning based agent (BAR) を設計する。
再帰的目標分解モジュールと状態整合性維持モジュールとステージメモリモジュールを備え、端末状態から始まる堅牢で一貫性があり、効率的な計画を立てる。
実験により,既存の手法よりもBARの方が優れていることを示すとともに,提案手法の有効性を示す。
関連論文リスト
- Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following [62.10809033451526]
本研究は,Large Language Models (LLM) を用いた Embodied Instruction following (EIF) タスクプランナの構築に焦点をあてる。
我々は,このタスクを部分観測可能なマルコフ決定プロセス (POMDP) として構成し,数発の仮定で頑健なプランナーの開発を目指す。
ALFREDデータセットに対する我々の実験は、プランナーが数ショットの仮定で競争性能を達成することを示す。
論文 参考訳(メタデータ) (2024-12-27T10:05:45Z) - Planning with Multi-Constraints via Collaborative Language Agents [13.550774629515843]
本稿では,協調型マルチエージェントシステムのためのゼロショット手法であるPMC(Planning with Multi-Constraints)を紹介する。
PMCは、制約で複雑なタスク計画を簡単にし、従属タスクの階層に分解する。
PMCはTravelPlannerで平均42.68%の成功率を記録し、GPT-4 (2.92%) をはるかに上回り、API-BankでReActを13.64%上回った。
論文 参考訳(メタデータ) (2024-05-26T10:33:17Z) - AgentKit: Structured LLM Reasoning with Dynamic Graphs [91.09525140733987]
多機能エージェントのための直感的なLCMプロンプトフレームワーク(AgentKit)を提案する。
AgentKitは、単純な自然言語プロンプトから複雑な"思考プロセス"を明示的に構築するための統一されたフレームワークを提供する。
論文 参考訳(メタデータ) (2024-04-17T15:40:45Z) - Plan, Eliminate, and Track -- Language Models are Good Teachers for
Embodied Agents [99.17668730578586]
事前訓練された大言語モデル(LLM)は、世界に関する手続き的な知識をキャプチャする。
Plan, Eliminate, and Track (PET)フレームワークはタスク記述をハイレベルなサブタスクのリストに変換する。
PETフレームワークは、人間の目標仕様への一般化のために、SOTAよりも15%改善されている。
論文 参考訳(メタデータ) (2023-05-03T20:11:22Z) - Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents [26.78244595330595]
「$underlineD$escribe」は、Large Language Models(LLMs)に基づく対話型計画手法である。
DEPSは、計画実行プロセスの$textitdescription$を統合することで、初期LLM生成の$textitplan$のエラー修正を容易にする。
実験は、70以上のMinecraftタスクを確実に達成できる最初のゼロショットマルチタスクエージェントのマイルストーンとなる。
論文 参考訳(メタデータ) (2023-02-03T06:06:27Z) - Modelling Multi-Agent Epistemic Planning in ASP [66.76082318001976]
本稿では,マルチショット・アンサー・セット・プログラミング・ベース・プランナの実装について述べる。
本稿は, アドホックなエピステミック状態表現とASPソルバの効率を生かしたプランナーが, 文献から収集したベンチマークに対して, 競合的な性能を示すことを示す。
論文 参考訳(メタデータ) (2020-08-07T06:35:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。