論文の概要: Hierarchical Object-Oriented POMDP Planning for Object Rearrangement
- arxiv url: http://arxiv.org/abs/2412.01348v2
- Date: Wed, 08 Jan 2025 18:20:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-09 14:53:51.323331
- Title: Hierarchical Object-Oriented POMDP Planning for Object Rearrangement
- Title(参考訳): オブジェクト再配置のための階層的オブジェクト指向POMDP計画
- Authors: Rajesh Mangannavar, Alan Fern, Prasad Tadepalli,
- Abstract要約: 本稿では,新しい階層的オブジェクト指向部分観測マルコフ決定プロセス(HOO-POMDP)の計画手法を提案する。
このアプローチは、(a)サブゴールを生成するオブジェクト指向のPOMDPプランナー、(b)サブゴール達成のための低レベルポリシーのセット、(c)連続低レベル世界を抽象計画に適した表現に変換する抽象システムからなる。
提案システムは,AI2-THORシミュレーション環境における様々なオブジェクト,部屋,問題タイプに対して,有望な結果で評価する。
- 参考スコア(独自算出の注目度): 23.160007389272575
- License:
- Abstract: We present an online planning framework for solving multi-object rearrangement problems in partially observable, multi-room environments. Current object rearrangement solutions, primarily based on Reinforcement Learning or hand-coded planning methods, often lack adaptability to diverse challenges. To address this limitation, we introduce a novel Hierarchical Object-Oriented Partially Observed Markov Decision Process (HOO-POMDP) planning approach. This approach comprises of (a) an object-oriented POMDP planner generating sub-goals, (b) a set of low-level policies for sub-goal achievement, and (c) an abstraction system converting the continuous low-level world into a representation suitable for abstract planning. We evaluate our system on varying numbers of objects, rooms, and problem types in AI2-THOR simulated environments with promising results.
- Abstract(参考訳): 本稿では、部分的に観測可能なマルチルーム環境において、複数オブジェクトの再構成問題を解決するためのオンライン・プランニング・フレームワークを提案する。
現在のオブジェクト再構成ソリューションは、主に強化学習または手作業による計画手法に基づいており、様々な課題への適応性に欠けることが多い。
この制限に対処するために,新しい階層的オブジェクト指向部分観測マルコフ決定プロセス(HOO-POMDP)を導入する。
このアプローチは
a) サブゴールを生成するオブジェクト指向のPOMDPプランナ
(b)下位目標達成のための下級政策の集合
(c) 連続的低レベル世界を抽象計画に適した表現に変換する抽象システム。
提案システムは,AI2-THORシミュレーション環境における様々なオブジェクト,部屋,問題タイプに対して,有望な結果で評価する。
関連論文リスト
- Unified Task and Motion Planning using Object-centric Abstractions of
Motion Constraints [56.283944756315066]
本稿では,タスクとモーションプランニングを一つの検索に統一するTAMP手法を提案する。
我々のアプローチは、オフザシェルフAIサーチの計算効率を活用して、物理的に実現可能な計画が得られるような、オブジェクト中心の動作制約の抽象化に基づいている。
論文 参考訳(メタデータ) (2023-12-29T14:00:20Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Compositional Foundation Models for Hierarchical Planning [52.18904315515153]
本稿では,言語,視覚,行動データを個別に訓練し,長期的課題を解決するための基礎モデルを提案する。
我々は,大規模なビデオ拡散モデルを用いて,環境に根ざした記号的計画を構築するために,大規模言語モデルを用いている。
生成したビデオプランは、生成したビデオからアクションを推論する逆ダイナミクスモデルを通じて、視覚運動制御に基礎を置いている。
論文 参考訳(メタデータ) (2023-09-15T17:44:05Z) - MANER: Multi-Agent Neural Rearrangement Planning of Objects in Cluttered
Environments [8.15681999722805]
本稿では,マルチエージェントオブジェクトアレンジメント計画のための学習ベースのフレームワークを提案する。
複雑な環境におけるタスクシークエンシングとパス計画の課題に対処する。
論文 参考訳(メタデータ) (2023-06-10T23:53:28Z) - Effective Baselines for Multiple Object Rearrangement Planning in
Partially Observable Mapped Environments [5.32429768581469]
本研究の目的は, 自家用知的エージェントが部分観測可能性の下で効率的に再配置を計画できるようにすることである。
本研究では, モノリシック・モジュール型深層強化学習(DRL)法について検討した。
モノリシックDRL法は多目的再配置に必要な長期計画では成功しない。
また、再配置が必要なオブジェクトが環境に均一に分散されている場合、我々の欲張りのあるモジュラーエージェントは経験的に最適であることを示す。
論文 参考訳(メタデータ) (2023-01-24T08:03:34Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - NeRP: Neural Rearrangement Planning for Unknown Objects [49.191284597526]
我々は,多段階のニューラルオブジェクト再構成計画のためのディープラーニングに基づくアプローチであるNeRP(Neural Rearrangement Planning)を提案する。
NeRPは、シミュレーションデータに基づいてトレーニングされ、現実世界に一般化される、これまで見たことのないオブジェクトで動作する。
論文 参考訳(メタデータ) (2021-06-02T17:56:27Z) - Multiple Plans are Better than One: Diverse Stochastic Planning [26.887796946596243]
計画上の問題では、望ましい仕様を完全にモデル化することはしばしば困難です。
特に、人間とロボットの相互作用において、そのような困難は、プライベートまたはモデルに複雑である人間の好みによって生じる可能性がある。
我々は、最適に近い代表行動の集合を生成することを目的とした、多種多様な計画と呼ばれる問題を定式化する。
論文 参考訳(メタデータ) (2020-12-31T07:29:11Z) - Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。
本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。
計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T18:08:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。