Fugu-MT 論文翻訳(概要): BAR: A Backward Reasoning based Agent for Complex Minecraft Tasks

論文の概要: BAR: A Backward Reasoning based Agent for Complex Minecraft Tasks

arxiv url: http://arxiv.org/abs/2505.14079v1
Date: Tue, 20 May 2025 08:35:35 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-21 14:49:52.93374
Title: BAR: A Backward Reasoning based Agent for Complex Minecraft Tasks
Title（参考訳）: BAR:複雑なMinecraftタスクのための後方推論ベースのエージェント
Authors: Weihong Du, Wenrui Liao, Binyu Yan, Hongru Liang, Anthony G. Cohn, Wenqiang Lei,
Abstract要約: タスクを完了するには、LLM(Big Language Model)ベースのエージェントを計画によって簡単に実行可能なステップに分解する必要がある。既存の研究は主にエージェントの初期状態から次にどのステップを実行するべきかを推測することで計画を実行する。実世界のシナリオに基づいて複雑なタスクをシミュレートする仮想環境であるMinecraftでこの問題を研究することを提案する。
参考スコア（独自算出の注目度）: 15.48158268901061
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large language model (LLM) based agents have shown great potential in following human instructions and automatically completing various tasks. To complete a task, the agent needs to decompose it into easily executed steps by planning. Existing studies mainly conduct the planning by inferring what steps should be executed next starting from the agent's initial state. However, this forward reasoning paradigm doesn't work well for complex tasks. We propose to study this issue in Minecraft, a virtual environment that simulates complex tasks based on real-world scenarios. We believe that the failure of forward reasoning is caused by the big perception gap between the agent's initial state and task goal. To this end, we leverage backward reasoning and make the planning starting from the terminal state, which can directly achieve the task goal in one step. Specifically, we design a BAckward Reasoning based agent (BAR). It is equipped with a recursive goal decomposition module, a state consistency maintaining module and a stage memory module to make robust, consistent, and efficient planning starting from the terminal state. Experimental results demonstrate the superiority of BAR over existing methods and the effectiveness of proposed modules.
Abstract（参考訳）: 大規模言語モデル(LLM)に基づくエージェントは、人間の指示に従い、様々なタスクを自動的に完了させる大きな可能性を示している。タスクを完了するには、エージェントはそれを計画によって簡単に実行されたステップに分解する必要がある。既存の研究は主にエージェントの初期状態から次にどのステップを実行するべきかを推測することで計画を実行する。しかし、この前方推論パラダイムは複雑なタスクではうまくいきません。実世界のシナリオに基づいて複雑なタスクをシミュレートする仮想環境であるMinecraftでこの問題を研究することを提案する。フォワード推論の失敗は,エージェントの初期状態とタスク目標との間の大きな認識ギャップによって引き起こされると考えている。この目的のために、後方推論を活用し、端末状態からプランニングをスタートさせ、1ステップでタスク目標を直接達成できる。具体的には,BAckward Reasoning based agent (BAR) を設計する。再帰的目標分解モジュールと状態整合性維持モジュールとステージメモリモジュールを備え、端末状態から始まる堅牢で一貫性があり、効率的な計画を立てる。実験により,既存の手法よりもBARの方が優れていることを示すとともに,提案手法の有効性を示す。

関連論文リスト

MapAgent: Trajectory-Constructed Memory-Augmented Planning for Mobile Task Automation [5.433829353194621]
MapAgentは、過去のトラジェクトリから構築されたメモリを活用して、現在のタスク計画を強化するフレームワークである。本稿では,メモリデータベースから関連ページを類似性に基づいて検索するタスクプランニング手法を提案する。実世界のシナリオにおける結果は、MapAgentが既存のメソッドよりも優れたパフォーマンスを実現していることを示している。
論文参考訳（メタデータ） (2025-07-29T16:05:32Z)
VerifyLLM: LLM-Based Pre-Execution Task Plan Verification for Robots [44.99833362998488]
本研究では,シミュレータや実環境で実行する前に,タスクプランを自動的に検証するアーキテクチャを提案する。このモジュールは、Large Language Modelsの推論機能を使用して、論理的一貫性を評価し、計画の潜在的なギャップを特定する。我々は,タスク計画の信頼性と効率の向上に寄与し,自律システムにおける堅牢な事前実行検証の必要性に対処する。
論文参考訳（メタデータ） (2025-07-07T15:31:36Z)
PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文参考訳（メタデータ） (2025-02-20T05:41:55Z)
Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following [62.10809033451526]
本研究は,Large Language Models (LLM) を用いた Embodied Instruction following (EIF) タスクプランナの構築に焦点をあてる。我々は,このタスクを部分観測可能なマルコフ決定プロセス (POMDP) として構成し,数発の仮定で頑健なプランナーの開発を目指す。 ALFREDデータセットに対する我々の実験は、プランナーが数ショットの仮定で競争性能を達成することを示す。
論文参考訳（メタデータ） (2024-12-27T10:05:45Z)
Planning with Multi-Constraints via Collaborative Language Agents [13.550774629515843]
本稿では,協調型マルチエージェントシステムのためのゼロショット手法であるPMC(Planning with Multi-Constraints)を紹介する。 PMCは、制約で複雑なタスク計画を簡単にし、従属タスクの階層に分解する。 PMCはTravelPlannerで平均42.68%の成功率を記録し、GPT-4 (2.92%) をはるかに上回り、API-BankでReActを13.64%上回った。
論文参考訳（メタデータ） (2024-05-26T10:33:17Z)
AgentKit: Structured LLM Reasoning with Dynamic Graphs [91.09525140733987]
多機能エージェントのための直感的なLCMプロンプトフレームワーク(AgentKit)を提案する。 AgentKitは、単純な自然言語プロンプトから複雑な"思考プロセス"を明示的に構築するための統一されたフレームワークを提供する。
論文参考訳（メタデータ） (2024-04-17T15:40:45Z)
Faithful Question Answering with Monte-Carlo Planning [78.02429369951363]
本稿では,FAME(Fithful Questioning with Monte-carlo planning)を提案する。我々は,タスクを離散的な意思決定問題として定式化し,推論環境とコントローラの相互作用によって解決する。 FAMEは標準ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2023-05-04T05:21:36Z)
Plan, Eliminate, and Track -- Language Models are Good Teachers for Embodied Agents [99.17668730578586]
事前訓練された大言語モデル(LLM)は、世界に関する手続き的な知識をキャプチャする。 Plan, Eliminate, and Track (PET)フレームワークはタスク記述をハイレベルなサブタスクのリストに変換する。 PETフレームワークは、人間の目標仕様への一般化のために、SOTAよりも15%改善されている。
論文参考訳（メタデータ） (2023-05-03T20:11:22Z)
Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents [26.78244595330595]
「$underlineD$escribe」は、Large Language Models(LLMs)に基づく対話型計画手法である。 DEPSは、計画実行プロセスの$textitdescription$を統合することで、初期LLM生成の$textitplan$のエラー修正を容易にする。実験は、70以上のMinecraftタスクを確実に達成できる最初のゼロショットマルチタスクエージェントのマイルストーンとなる。
論文参考訳（メタデータ） (2023-02-03T06:06:27Z)
Modelling Multi-Agent Epistemic Planning in ASP [66.76082318001976]
本稿では,マルチショット・アンサー・セット・プログラミング・ベース・プランナの実装について述べる。本稿は, アドホックなエピステミック状態表現とASPソルバの効率を生かしたプランナーが, 文献から収集したベンチマークに対して, 競合的な性能を示すことを示す。
論文参考訳（メタデータ） (2020-08-07T06:35:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。