論文の概要: Exploratory Retrieval-Augmented Planning For Continual Embodied Instruction Following
- arxiv url: http://arxiv.org/abs/2509.08222v1
- Date: Wed, 10 Sep 2025 01:39:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.28422
- Title: Exploratory Retrieval-Augmented Planning For Continual Embodied Instruction Following
- Title(参考訳): 連続的体操指導における探索的検索強化計画
- Authors: Minjong Yoo, Jinwoo Jang, Wei-jin Park, Honguk Woo,
- Abstract要約: 本研究では,動的非定常環境におけるエンボディエージェントのタスクに追従した継続的指導に対処するために,探索的検索型拡張計画(ExRAP)フレームワークを提案する。
このフレームワークは、物理環境を効率的に探索し、環境コンテキスト記憶を確立することにより、大規模言語モデルの具体的推論能力を高める。
目標達成率と実行効率の両面で、最先端のLCMベースのタスク計画アプローチを一貫して上回ります。
- 参考スコア(独自算出の注目度): 30.757285244293794
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study presents an Exploratory Retrieval-Augmented Planning (ExRAP) framework, designed to tackle continual instruction following tasks of embodied agents in dynamic, non-stationary environments. The framework enhances Large Language Models' (LLMs) embodied reasoning capabilities by efficiently exploring the physical environment and establishing the environmental context memory, thereby effectively grounding the task planning process in time-varying environment contexts. In ExRAP, given multiple continual instruction following tasks, each instruction is decomposed into queries on the environmental context memory and task executions conditioned on the query results. To efficiently handle these multiple tasks that are performed continuously and simultaneously, we implement an exploration-integrated task planning scheme by incorporating the {information-based exploration} into the LLM-based planning process. Combined with memory-augmented query evaluation, this integrated scheme not only allows for a better balance between the validity of the environmental context memory and the load of environment exploration, but also improves overall task performance. Furthermore, we devise a {temporal consistency refinement} scheme for query evaluation to address the inherent decay of knowledge in the memory. Through experiments with VirtualHome, ALFRED, and CARLA, our approach demonstrates robustness against a variety of embodied instruction following scenarios involving different instruction scales and types, and non-stationarity degrees, and it consistently outperforms other state-of-the-art LLM-based task planning approaches in terms of both goal success rate and execution efficiency.
- Abstract(参考訳): 本研究では,動的非定常環境におけるエンボディエージェントのタスクに追従した継続的指導に対処するために,探索的検索型拡張計画(ExRAP)フレームワークを提案する。
このフレームワークは、物理環境を効率的に探索し、環境コンテキスト記憶を確立することにより、推論能力を具現化したLarge Language Models(LLM)を強化し、時間変化した環境コンテキストにおけるタスク計画プロセスを効果的に構築する。
ExRAPでは、複数の連続的な命令が与えられた後、各命令は、環境コンテキストメモリ上のクエリと、クエリ結果に条件付けられたタスク実行に分解される。
連続的に同時に実行されるこれらの複数のタスクを効率的に処理するために,LLM ベースの計画プロセスに {information-based Explor} を組み込むことで,探索統合タスク計画手法を実装した。
メモリ拡張クエリ評価と組み合わせることで、環境コンテキストメモリの有効性と環境探索の負荷とのバランスを改善するだけでなく、全体的なタスク性能を向上させることができる。
さらに,メモリ内の知識の固有減衰に対処するため,クエリ評価のための時間的整合性改善手法を考案した。
提案手法は,VirtualHome,ALFRED,CARLAによる実験を通じて,異なる命令尺度や型,非定常度といったシナリオに従って,様々な具体的命令に対する堅牢性を実証し,目標達成率と実行効率の両面から,他の最先端のLCMベースのタスク計画手法よりも一貫して優れていることを示す。
関連論文リスト
- What to Do Next? Memorizing skills from Egocentric Instructional Video [43.59787683244105]
本稿では,新しいタスクである対話型アクションプランニングを提案し,トポロジカルアプライアンスメモリとトランスフォーマーアーキテクチャを組み合わせたアプローチを提案する。
実験の結果,提案手法は意味のある表現を学習し,その結果,行動偏差が発生すると性能が向上し,頑健になることが示された。
論文 参考訳(メタデータ) (2025-07-01T22:53:41Z) - Unlocking Smarter Device Control: Foresighted Planning with a World Model-Driven Code Execution Approach [82.27842884709378]
本研究では,自然言語理解と構造化推論を優先し,エージェントの環境に対するグローバルな理解を高める枠組みを提案する。
本手法は,従来の手法,特にタスク成功率の44.4%向上を達成している。
論文 参考訳(メタデータ) (2025-05-22T09:08:47Z) - Onto-LLM-TAMP: Knowledge-oriented Task and Motion Planning using Large Language Models [0.21990652930491858]
本研究は,タスクコンテキスト推論と知識ベース環境記述を用いて,ユーザプロンプトを洗練・拡張する知識ベース推論を用いた新しいオント・LLM-TAMPフレームワークを提案する。
提案フレームワークはシミュレーションと実世界のシナリオの両方を通じて検証され,動的環境への適応性や意味論的に正しいタスクプランの生成の観点から,ベースラインアプローチに対する大幅な改善が示された。
論文 参考訳(メタデータ) (2024-12-10T13:18:45Z) - ET-Plan-Bench: Embodied Task-level Planning Benchmark Towards Spatial-Temporal Cognition with Foundation Models [38.89166693142495]
ET-Plan-Benchは、Large Language Models (LLMs) を用いたタスク計画の具体化のためのベンチマークである。
様々な難易度や複雑さのレベルにおいて、制御可能で多様な実施タスクが特徴である。
我々のベンチマークでは、大規模で定量化され、高度に自動化され、きめ細かな診断フレームワークとして認識されている。
論文 参考訳(メタデータ) (2024-10-02T19:56:38Z) - AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation [81.32722475387364]
大規模言語モデルに基づくエージェントが注目され、ますます人気が高まっている。
計画能力は LLM ベースのエージェントの重要な構成要素であり、通常は初期状態から望ましい目標を達成する必要がある。
近年の研究では、専門家レベルの軌跡を指導訓練用LLMに活用することで、効果的に計画能力を向上させることが示されている。
論文 参考訳(メタデータ) (2024-08-01T17:59:46Z) - EgoPlan-Bench: Benchmarking Multimodal Large Language Models for Human-Level Planning [84.6451394629312]
実世界のシナリオにおけるMLLMの計画能力を評価するベンチマークであるEgoPlan-Benchを紹介する。
EgoPlan-Benchは、人間レベルのタスクプランニングを実現するためのMLLMの改善のかなりの範囲を浮き彫りにする。
また,EgoPlan-Bench上でのモデル性能を効果的に向上する特殊命令チューニングデータセットであるEgoPlan-ITを提案する。
論文 参考訳(メタデータ) (2023-12-11T03:35:58Z) - Reinforcement Learning with Success Induced Task Prioritization [68.8204255655161]
本稿では,自動カリキュラム学習のためのフレームワークであるSuccess induced Task Prioritization (SITP)を紹介する。
アルゴリズムはエージェントに最速の学習を提供するタスクの順序を選択する。
我々は,SITPが他のカリキュラム設計手法と一致するか,あるいは上回っていることを実証する。
論文 参考訳(メタデータ) (2022-12-30T12:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。