論文の概要: Planning with affordances: Integrating learned affordance models and symbolic planning
- arxiv url: http://arxiv.org/abs/2502.02768v1
- Date: Tue, 04 Feb 2025 23:15:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 14:26:47.234911
- Title: Planning with affordances: Integrating learned affordance models and symbolic planning
- Title(参考訳): 余裕のある計画:学習した余裕のモデルと象徴的な計画の統合
- Authors: Rajesh Mangannavar,
- Abstract要約: 既存のタスク・アンド・モーション・プランニング・フレームワークを世界のオブジェクトの学習能力モデルで拡張する。
それぞれのタスクは、世界の現在の状態を所定の目標状態に変更したものと見なすことができます。
シンボリックプランニングアルゴリズムは、この情報と開始および目標状態を用いて、望ましい目標状態に到達するための実行可能なプランを作成する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Intelligent agents working in real-world environments must be able to learn about the environment and its capabilities which enable them to take actions to change to the state of the world to complete a complex multi-step task in a photorealistic environment. Learning about the environment is especially important to perform various multiple-step tasks without having to redefine an agent's action set for different tasks or environment settings. In our work, we augment an existing task and motion planning framework with learned affordance models of objects in the world to enable planning and executing multi-step tasks using learned models. Each task can be seen as changing the current state of the world to a given goal state. The affordance models provide us with what actions are possible and how to perform those actions in any given state. A symbolic planning algorithm uses this information and the starting and goal state to create a feasible plan to reach the desired goal state to complete a given task. We demonstrate our approach in a virtual 3D photorealistic environment, AI2-Thor, and evaluate it on real-world tasks. Our results show that our agent quickly learns how to interact with the environment and is well prepared to perform tasks such as "Moving an object out of the way to reach the desired location."
- Abstract(参考訳): 実環境で働くインテリジェントエージェントは、環境とその能力について学ぶことができなければならず、それによって、光現実的な環境で複雑なマルチステップタスクを完了するために、世界の状態に変化を起こすことができる。
環境について学ぶことは、異なるタスクや環境設定のためにエージェントのアクションセットを再定義することなく、様々なマルチステップタスクを実行するために特に重要である。
本研究では,学習モデルを用いた多段階タスクの計画と実行を可能にするため,既存のタスクと動作計画フレームワークを世界中の学習対象の余裕モデルで拡張する。
それぞれのタスクは、世界の現在の状態を所定の目標状態に変更したものと見なすことができます。
余剰モデルによって、どんなアクションが可能か、そのアクションをどんな状態でも実行する方法が提供されます。
シンボリックプランニングアルゴリズムは、この情報と開始および目標状態を使用して、所望の目標状態に到達するための実行可能なプランを作成し、与えられたタスクを完了させる。
仮想的な3Dフォトリアリスティック環境であるAI2-Thorでのアプローチを実証し、実世界のタスクで評価する。
以上の結果から,我々のエージェントは環境とのインタラクションの仕方を素早く学習し,「所望の場所にたどり着く方法からオブジェクトを移動させる」といったタスクをこなす準備が整っていることがわかった。
関連論文リスト
- CLIMB: Language-Guided Continual Learning for Task Planning with Iterative Model Building [30.274897468701592]
ロボットタスク計画のための連続学習フレームワークCLIMBを提案する。
CLIMBは、自然言語の記述からモデルを構築し、タスクを解決しながら、予期せぬ述語を学び、その情報を将来の問題に保存する。
またBlocksWorld++ドメインも開発しています。これは、簡単に使える実環境と、継続的な学習を評価するのに困難なタスクのカリキュラムを兼ね備えたシミュレーション環境です。
論文 参考訳(メタデータ) (2024-10-17T16:53:43Z) - Flex: End-to-End Text-Instructed Visual Navigation with Foundation Models [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly-lexically) で合成され,VLM(Vision Language Models) をフリーズしたパッチワイド特徴抽出器として利用するフレームワークである。
本研究では,本手法が4段階のフライ・トゥ・ターゲットタスクにおいて有効であることを示す。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Embodied Instruction Following in Unknown Environments [66.60163202450954]
未知環境における複雑なタスクに対するEIF(Embodied instruction following)法を提案する。
我々は,ハイレベルなタスクプランナと低レベルな探索コントローラを含む,階層的な具体化命令に従うフレームワークを構築した。
タスクプランナに対しては、タスク完了プロセスと既知の視覚的手がかりに基づいて、人間の目標達成のための実行可能なステップバイステッププランを生成する。
論文 参考訳(メタデータ) (2024-06-17T17:55:40Z) - Embodied Task Planning with Large Language Models [86.63533340293361]
本研究では,現場制約を考慮した地上計画のための具体的タスクにおけるTAsk Planing Agent (TaPA)を提案する。
推論の際には,オープンボキャブラリオブジェクト検出器を様々な場所で収集された多視点RGB画像に拡張することにより,シーン内の物体を検出する。
実験の結果,我々のTaPAフレームワークから生成されたプランは,LLaVAやGPT-3.5よりも大きなマージンで高い成功率が得られることがわかった。
論文 参考訳(メタデータ) (2023-07-04T17:58:25Z) - MANER: Multi-Agent Neural Rearrangement Planning of Objects in Cluttered
Environments [8.15681999722805]
本稿では,マルチエージェントオブジェクトアレンジメント計画のための学習ベースのフレームワークを提案する。
複雑な環境におけるタスクシークエンシングとパス計画の課題に対処する。
論文 参考訳(メタデータ) (2023-06-10T23:53:28Z) - Egocentric Planning for Scalable Embodied Task Achievement [6.870094263016224]
エゴセントリックプランニング(Egocentric Planning)は、複雑な環境におけるタスクを解決するために、シンボリックプランニングとオブジェクト指向のPOMDPを組み合わせた革新的なアプローチである。
国内タスク用に設計されたシミュレーション環境であるALFREDにおける我々のアプローチを評価し,そのスケーラビリティを実証した。
本手法では, エージェントの行動の前提条件と影響について, 信頼性の高い認識と記号的記述の特定, 学習が必要である。
論文 参考訳(メタデータ) (2023-06-02T06:41:24Z) - ProgPrompt: Generating Situated Robot Task Plans using Large Language
Models [68.57918965060787]
大規模言語モデル(LLM)は、タスク計画中の潜在的な次のアクションを評価するために使用することができる。
本稿では, プログラム型LCMプロンプト構造を用いて, 配置環境間での計画生成機能を実現する。
論文 参考訳(メタデータ) (2022-09-22T20:29:49Z) - Long-Horizon Manipulation of Unknown Objects via Task and Motion
Planning with Estimated Affordances [26.082034134908785]
操作可能なオブジェクトの集合に関する事前知識がなくても,タスク・アンド・モーション・プランナが知的行動の計画に利用できることを示す。
この戦略により、単一のシステムが様々な実世界のマルチステップ操作タスクを実行できることを実証する。
論文 参考訳(メタデータ) (2021-08-09T16:13:47Z) - PackIt: A Virtual Environment for Geometric Planning [68.79816936618454]
PackItは、幾何学的計画を行う能力を評価し、潜在的に学習する仮想環境である。
進化的アルゴリズムを用いて,一組の難解なパッケージングタスクを構築した。
論文 参考訳(メタデータ) (2020-07-21T22:51:17Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。