論文の概要: Effective Baselines for Multiple Object Rearrangement Planning in
Partially Observable Mapped Environments
- arxiv url: http://arxiv.org/abs/2301.09854v1
- Date: Tue, 24 Jan 2023 08:03:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 14:09:07.684471
- Title: Effective Baselines for Multiple Object Rearrangement Planning in
Partially Observable Mapped Environments
- Title(参考訳): 部分観測可能なマッピング環境における複数物体配置計画のための効果的なベースライン
- Authors: Engin Tekin, Elaheh Barati, Nitin Kamra, Ruta Desai
- Abstract要約: 本研究の目的は, 自家用知的エージェントが部分観測可能性の下で効率的に再配置を計画できるようにすることである。
本研究では, モノリシック・モジュール型深層強化学習(DRL)法について検討した。
モノリシックDRL法は多目的再配置に必要な長期計画では成功しない。
また、再配置が必要なオブジェクトが環境に均一に分散されている場合、我々の欲張りのあるモジュラーエージェントは経験的に最適であることを示す。
- 参考スコア(独自算出の注目度): 5.32429768581469
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Many real-world tasks, from house-cleaning to cooking, can be formulated as
multi-object rearrangement problems -- where an agent needs to get specific
objects into appropriate goal states. For such problems, we focus on the
setting that assumes a pre-specified goal state, availability of perfect
manipulation and object recognition capabilities, and a static map of the
environment but unknown initial location of objects to be rearranged. Our goal
is to enable home-assistive intelligent agents to efficiently plan for
rearrangement under such partial observability. This requires efficient
trade-offs between exploration of the environment and planning for
rearrangement, which is challenging because of long-horizon nature of the
problem. To make progress on this problem, we first analyze the effects of
various factors such as number of objects and receptacles, agent carrying
capacity, environment layouts etc. on exploration and planning for
rearrangement using classical methods. We then investigate both monolithic and
modular deep reinforcement learning (DRL) methods for planning in our setting.
We find that monolithic DRL methods do not succeed at long-horizon planning
needed for multi-object rearrangement. Instead, modular greedy approaches
surprisingly perform reasonably well and emerge as competitive baselines for
planning with partial observability in multi-object rearrangement problems. We
also show that our greedy modular agents are empirically optimal when the
objects that need to be rearranged are uniformly distributed in the environment
-- thereby contributing baselines with strong performance for future work on
multi-object rearrangement planning in partially observable settings.
- Abstract(参考訳): ハウスクリーニングから料理まで、多くの現実世界のタスクは、エージェントが特定のオブジェクトを適切なゴール状態に保つ必要があるマルチオブジェクト再配置問題として定式化することができる。
このような問題に対して,事前指定された目標状態,完全な操作とオブジェクト認識機能の提供,環境の静的マップなど,再配置すべきオブジェクトの初期位置が不明な設定に注目する。
我々の目標は,このような部分的可観測性の下で,家庭支援型知的エージェントが効率的に再配置を計画できるようにすることである。
これは、環境探索と再配置計画の間の効率的なトレードオフを必要としており、この問題の長期的性質のために困難である。
この問題を進展させるために,我々はまず,オブジェクト数やレセプタクル数,エージェント搬送能力,環境レイアウトなど様々な要因が,古典的手法による再配置の探索と計画に及ぼす影響を解析した。
次に,設計計画のためのモノリシックおよびモジュール型深層強化学習(drl)手法について検討した。
モノリシックDRL法は多目的再配置に必要な長期計画では成功しない。
その代わり、モジュラーグリーディアプローチは驚くほどうまく機能し、多目的再配置問題における部分可観測性を持つ計画の競争ベースラインとして現れる。
また、我々は、再配置が必要なオブジェクトが一様に環境に分散されているとき、我々の欲張りなモジュラーエージェントが経験的に最適であることを示します。
関連論文リスト
- ET-Plan-Bench: Embodied Task-level Planning Benchmark Towards Spatial-Temporal Cognition with Foundation Models [39.606908488885125]
ET-Plan-Benchは、Large Language Models (LLMs) を用いたタスク計画の具体化のためのベンチマークである。
様々な難易度や複雑さのレベルにおいて、制御可能で多様な実施タスクが特徴である。
我々のベンチマークでは、大規模で定量化され、高度に自動化され、きめ細かな診断フレームワークとして認識されている。
論文 参考訳(メタデータ) (2024-10-02T19:56:38Z) - Unified Task and Motion Planning using Object-centric Abstractions of
Motion Constraints [56.283944756315066]
本稿では,タスクとモーションプランニングを一つの検索に統一するTAMP手法を提案する。
我々のアプローチは、オフザシェルフAIサーチの計算効率を活用して、物理的に実現可能な計画が得られるような、オブジェクト中心の動作制約の抽象化に基づいている。
論文 参考訳(メタデータ) (2023-12-29T14:00:20Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - MANER: Multi-Agent Neural Rearrangement Planning of Objects in Cluttered
Environments [8.15681999722805]
本稿では,マルチエージェントオブジェクトアレンジメント計画のための学習ベースのフレームワークを提案する。
複雑な環境におけるタスクシークエンシングとパス計画の課題に対処する。
論文 参考訳(メタデータ) (2023-06-10T23:53:28Z) - AdaPlanner: Adaptive Planning from Feedback with Language Models [56.367020818139665]
大規模言語モデル(LLM)は、最近、シーケンシャルな意思決定タスクの自律的エージェントとして機能する可能性を実証している。
本研究では,LLMエージェントが環境フィードバックに応じて自己生成計画を適応的に改善することのできるクローズドループアプローチであるAdaPlannerを提案する。
幻覚を緩和するために,様々なタスク,環境,エージェント機能にまたがる計画生成を容易にするコードスタイルのLCMプロンプト構造を開発した。
論文 参考訳(メタデータ) (2023-05-26T05:52:27Z) - Online Tool Selection with Learned Grasp Prediction Models [15.915410623440875]
深層学習に基づく把握予測モデルは、ロボットビンピッキングシステムの業界標準となっている。
ピックの成功を最大化するために、生産環境は、しばしばターゲットオブジェクトに基づいて、オンザフライで交換できるいくつかのエンドエフェクタツールを備えている。
システムスループットを改善するために、グリップの順序、およびそれに対応するツール変更アクションをどのように選択するかを示す。
論文 参考訳(メタデータ) (2023-02-15T20:52:38Z) - Task Allocation for Multi-Robot Task and Motion Planning: a case for
Object Picking in Cluttered Workspaces [1.3535770763481902]
統合型マルチロボットタスクとモーションプランニング手法を提案する。
未知のオブジェクトの再配列を含むタスクを処理できる。
2つのフランカエミカマニピュレータのシミュレーション実験で実験を行った。
論文 参考訳(メタデータ) (2021-10-08T12:36:43Z) - Hierarchical Policy for Non-prehensile Multi-object Rearrangement with
Deep Reinforcement Learning and Monte Carlo Tree Search [30.31462739429364]
本稿では,非包括的多目的再構成のための分割と征服のための階層的ポリシーを提案する。
高レベルポリシーでは、モンテカルロ木探索は複数のオブジェクト間の最適な再配置シーケンスを効率的に探索する。
低レベルポリシーでは、ロボットは経路プリミティブの順序に従って経路を計画し、目標に1つずつ近づくためにオブジェクトを操作する。
論文 参考訳(メタデータ) (2021-09-18T17:24:37Z) - NeRP: Neural Rearrangement Planning for Unknown Objects [49.191284597526]
我々は,多段階のニューラルオブジェクト再構成計画のためのディープラーニングに基づくアプローチであるNeRP(Neural Rearrangement Planning)を提案する。
NeRPは、シミュレーションデータに基づいてトレーニングされ、現実世界に一般化される、これまで見たことのないオブジェクトで動作する。
論文 参考訳(メタデータ) (2021-06-02T17:56:27Z) - PackIt: A Virtual Environment for Geometric Planning [68.79816936618454]
PackItは、幾何学的計画を行う能力を評価し、潜在的に学習する仮想環境である。
進化的アルゴリズムを用いて,一組の難解なパッケージングタスクを構築した。
論文 参考訳(メタデータ) (2020-07-21T22:51:17Z) - Bottom-up mechanism and improved contract net protocol for the dynamic
task planning of heterogeneous Earth observation resources [61.75759893720484]
地球観測資源は、災害救助、被害評価、関連する領域においてますます不可欠になりつつある。
観測要求の変更や悪天候の発生、資源の失敗など、予測できない多くの要因は、スケジュールされた観測計画が実行不可能になる可能性がある。
不均質な地球観測資源の動的タスク計画を容易にするため、ボトムアップ分散協調フレームワークと改良された契約網を提案する。
論文 参考訳(メタデータ) (2020-07-13T03:51:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。