Fugu-MT 論文翻訳(概要): Egocentric Planning for Scalable Embodied Task Achievement

論文の概要: Egocentric Planning for Scalable Embodied Task Achievement

arxiv url: http://arxiv.org/abs/2306.01295v1
Date: Fri, 2 Jun 2023 06:41:24 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-05 16:33:11.623004
Title: Egocentric Planning for Scalable Embodied Task Achievement
Title（参考訳）: スケーラブルな具体化タスク達成のためのエゴセントリックプランニング
Authors: Xiaotian Liu, Hector Palacios, Christian Muise
Abstract要約: エゴセントリックプランニング(Egocentric Planning)は、複雑な環境におけるタスクを解決するために、シンボリックプランニングとオブジェクト指向のPOMDPを組み合わせた革新的なアプローチである。国内タスク用に設計されたシミュレーション環境であるALFREDにおける我々のアプローチを評価し,そのスケーラビリティを実証した。本手法では, エージェントの行動の前提条件と影響について, 信頼性の高い認識と記号的記述の特定, 学習が必要である。
参考スコア（独自算出の注目度）: 6.870094263016224
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Embodied agents face significant challenges when tasked with performing actions in diverse environments, particularly in generalizing across object types and executing suitable actions to accomplish tasks. Furthermore, agents should exhibit robustness, minimizing the execution of illegal actions. In this work, we present Egocentric Planning, an innovative approach that combines symbolic planning and Object-oriented POMDPs to solve tasks in complex environments, harnessing existing models for visual perception and natural language processing. We evaluated our approach in ALFRED, a simulated environment designed for domestic tasks, and demonstrated its high scalability, achieving an impressive 36.07% unseen success rate in the ALFRED benchmark and winning the ALFRED challenge at CVPR Embodied AI workshop. Our method requires reliable perception and the specification or learning of a symbolic description of the preconditions and effects of the agent's actions, as well as what object types reveal information about others. It is capable of naturally scaling to solve new tasks beyond ALFRED, as long as they can be solved using the available skills. This work offers a solid baseline for studying end-to-end and hybrid methods that aim to generalize to new tasks, including recent approaches relying on LLMs, but often struggle to scale to long sequences of actions or produce robust plans for novel tasks.
Abstract（参考訳）: エージェントは、様々な環境でのアクションの実行、特に、オブジェクトタイプをまたいだ一般化、タスクを達成するための適切なアクションの実行において、重要な課題に直面します。さらに、エージェントはロバスト性を示し、違法なアクションの実行を最小化すべきである。本研究では,記号的計画とオブジェクト指向のPOMDPを組み合わせて複雑な環境下でのタスクを解決し,視覚知覚と自然言語処理のための既存のモデルを活用する革新的な手法であるEgocentric Planningを提案する。我々は、国内タスク用に設計されたシミュレーション環境であるALFREDにおける我々のアプローチを評価し、その高いスケーラビリティを実証し、ALFREDベンチマークで目立たない成功率36.07%を達成し、CVPR Embodied AIワークショップでALFREDに挑戦した。本手法は,信頼度の高い知覚と,エージェントの行動の前提条件と効果の象徴的記述の仕様や学習,および他者に関する情報を提示するオブジェクトタイプを必要とする。利用可能なスキルを使って解決できる限り、アルフレッドを超えて新しいタスクを自然にスケーリングして解決することができる。この研究は、LLMに依存する最近のアプローチを含む、新しいタスクへの一般化を目的としたエンドツーエンドとハイブリッドの手法を研究するための確かなベースラインを提供するが、多くの場合、長い一連のアクションにスケールしたり、新しいタスクの堅牢な計画を作成するのに苦労する。

関連論文リスト

Task-Aware Virtual Training: Enhancing Generalization in Meta-Reinforcement Learning for Out-of-Distribution Tasks [4.374837991804085]
Task-Aware Virtual Training (TAVT)は、トレーニングとアウト・オブ・ディストリビューション(OOD)シナリオの両方のタスク特性をキャプチャする新しいアルゴリズムである。数値計算の結果,TAVT は様々な MuJoCo および MetaWorld 環境における OOD タスクの一般化を著しく促進することが示された。
論文参考訳（メタデータ） (2025-02-05T02:31:50Z)
Planning with affordances: Integrating learned affordance models and symbolic planning [0.0]
既存のタスク・アンド・モーション・プランニング・フレームワークを世界のオブジェクトの学習能力モデルで拡張する。それぞれのタスクは、世界の現在の状態を所定の目標状態に変更したものと見なすことができます。シンボリックプランニングアルゴリズムは、この情報と開始および目標状態を用いて、望ましい目標状態に到達するための実行可能なプランを作成する。
論文参考訳（メタデータ） (2025-02-04T23:15:38Z)
Anticipate & Act : Integrating LLMs and Classical Planning for Efficient Task Execution in Household Environments [16.482992646001996]
我々は,これらの課題を共同で達成する行動列を計算し,家庭内課題を予測するための枠組みを開発する。今後の課題を考慮しないシステムと比較して,実行時間の31%削減を実証する。
論文参考訳（メタデータ） (2025-02-04T07:31:55Z)
Adaptformer: Sequence models as adaptive iterative planners [0.0]
マルチタスクミッションにおける意思決定は、自律システムにとって難しい問題である。本稿では、サンプル効率の高い探索と利用のためにシーケンスモデルを利用する適応型プランナであるAdaptformerを提案する。マルチゴール迷路到達性タスクにおいて,Adaptformerは最先端の手法よりも25%高い性能を示した。
論文参考訳（メタデータ） (2024-11-30T00:34:41Z)
ET-Plan-Bench: Embodied Task-level Planning Benchmark Towards Spatial-Temporal Cognition with Foundation Models [39.606908488885125]
ET-Plan-Benchは、Large Language Models (LLMs) を用いたタスク計画の具体化のためのベンチマークである。様々な難易度や複雑さのレベルにおいて、制御可能で多様な実施タスクが特徴である。我々のベンチマークでは、大規模で定量化され、高度に自動化され、きめ細かな診断フレームワークとして認識されている。
論文参考訳（メタデータ） (2024-10-02T19:56:38Z)
Spatial Reasoning and Planning for Deep Embodied Agents [2.7195102129095003]
この論文は空間的推論と計画タスクのためのデータ駆動手法の開発を探求する。学習効率、解釈可能性、新しいシナリオ間の伝達可能性の向上に重点を置いている。
論文参考訳（メタデータ） (2024-09-28T23:05:56Z)
AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation [89.68433168477227]
LLM(Large Language Model)ベースのエージェントは注目され、ますます人気が高まっている。本稿では,LLMの学習指導による計画能力の向上について検討する。この制限に対処するために,多様な環境の自動合成と段階的な計画課題について検討する。
論文参考訳（メタデータ） (2024-08-01T17:59:46Z)
Embodied Instruction Following in Unknown Environments [66.60163202450954]
未知環境における複雑なタスクに対するEIF(Embodied instruction following)法を提案する。我々は,ハイレベルなタスクプランナと低レベルな探索コントローラを含む,階層的な具体化命令に従うフレームワークを構築した。タスクプランナに対しては、タスク完了プロセスと既知の視覚的手がかりに基づいて、人間の目標達成のための実行可能なステップバイステッププランを生成する。
論文参考訳（メタデータ） (2024-06-17T17:55:40Z)
Embodied Task Planning with Large Language Models [86.63533340293361]
本研究では,現場制約を考慮した地上計画のための具体的タスクにおけるTAsk Planing Agent (TaPA)を提案する。推論の際には,オープンボキャブラリオブジェクト検出器を様々な場所で収集された多視点RGB画像に拡張することにより,シーン内の物体を検出する。実験の結果,我々のTaPAフレームワークから生成されたプランは,LLaVAやGPT-3.5よりも大きなマージンで高い成功率が得られることがわかった。
論文参考訳（メタデータ） (2023-07-04T17:58:25Z)
Automaton-Guided Curriculum Generation for Reinforcement Learning Agents [14.20447398253189]
Automaton-Guided Curriculum Learning (AGCL) は、DAG(Directed Acyclic Graphs)の形式で、対象タスクのためのカリキュラムを自動生成する新しい方法である。 AGCL は決定論的有限オートマトン (DFA) の形式で仕様を符号化し、DFA とオブジェクト指向 MDP 表現を使ってカリキュラムを DAG として生成する。グリッドワールドと物理に基づくシミュレーションロボティクス領域の実験では、AGCLが生み出すカリキュラムが時間と閾値のパフォーマンスを向上させることが示されている。
論文参考訳（メタデータ） (2023-04-11T15:14:31Z)
Knowledge Retrieval using Functional Object-Oriented Network [0.0]
機能的オブジェクト指向ネットワーク(英: functional object-oriented network、FOON)は、グラフの形をとるシンボリックタスク計画の知識表現である。グラフ検索手法により、FOONから操作動作シーケンスを生成し、所望の目的を達成する。結果は、シミュレーション環境で望まれる目的を達成するために、FOONによって生成された動きシーケンスを用いて説明される。
論文参考訳（メタデータ） (2022-11-06T06:02:29Z)
Reinforcement Learning for Sparse-Reward Object-Interaction Tasks in a First-person Simulated 3D Environment [73.9469267445146]
高忠実な3Dシミュレーション環境において、AI2Thorのような一対一のオブジェクトインタラクションタスクは、強化学習エージェントに顕著なサンプル効率の課題をもたらす。補助的なタスクとして注意的オブジェクトモデルを学ぶことで、監督なしに、ゼロからオブジェクトインタラクションタスクを学習できることが示される。
論文参考訳（メタデータ） (2020-10-28T19:27:26Z)
Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文参考訳（メタデータ） (2020-07-14T16:42:59Z)
Adaptive Procedural Task Generation for Hard-Exploration Problems [78.20918366839399]
ハード探索問題における強化学習を容易にするために,適応手続きタスク生成(APT-Gen)を導入する。私たちのアプローチの中心は、ブラックボックスの手続き生成モジュールを通じてパラメータ化されたタスク空間からタスクを作成することを学習するタスクジェネレータです。学習進捗の直接指標がない場合のカリキュラム学習を可能にするために,生成したタスクにおけるエージェントのパフォーマンスと,対象タスクとの類似性をバランスさせてタスクジェネレータを訓練することを提案する。
論文参考訳（メタデータ） (2020-07-01T09:38:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。