論文の概要: Effective Baselines for Multiple Object Rearrangement Planning in
Partially Observable Mapped Environments
- arxiv url: http://arxiv.org/abs/2301.09854v1
- Date: Tue, 24 Jan 2023 08:03:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 14:09:07.684471
- Title: Effective Baselines for Multiple Object Rearrangement Planning in
Partially Observable Mapped Environments
- Title(参考訳): 部分観測可能なマッピング環境における複数物体配置計画のための効果的なベースライン
- Authors: Engin Tekin, Elaheh Barati, Nitin Kamra, Ruta Desai
- Abstract要約: 本研究の目的は, 自家用知的エージェントが部分観測可能性の下で効率的に再配置を計画できるようにすることである。
本研究では, モノリシック・モジュール型深層強化学習(DRL)法について検討した。
モノリシックDRL法は多目的再配置に必要な長期計画では成功しない。
また、再配置が必要なオブジェクトが環境に均一に分散されている場合、我々の欲張りのあるモジュラーエージェントは経験的に最適であることを示す。
- 参考スコア(独自算出の注目度): 5.32429768581469
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Many real-world tasks, from house-cleaning to cooking, can be formulated as
multi-object rearrangement problems -- where an agent needs to get specific
objects into appropriate goal states. For such problems, we focus on the
setting that assumes a pre-specified goal state, availability of perfect
manipulation and object recognition capabilities, and a static map of the
environment but unknown initial location of objects to be rearranged. Our goal
is to enable home-assistive intelligent agents to efficiently plan for
rearrangement under such partial observability. This requires efficient
trade-offs between exploration of the environment and planning for
rearrangement, which is challenging because of long-horizon nature of the
problem. To make progress on this problem, we first analyze the effects of
various factors such as number of objects and receptacles, agent carrying
capacity, environment layouts etc. on exploration and planning for
rearrangement using classical methods. We then investigate both monolithic and
modular deep reinforcement learning (DRL) methods for planning in our setting.
We find that monolithic DRL methods do not succeed at long-horizon planning
needed for multi-object rearrangement. Instead, modular greedy approaches
surprisingly perform reasonably well and emerge as competitive baselines for
planning with partial observability in multi-object rearrangement problems. We
also show that our greedy modular agents are empirically optimal when the
objects that need to be rearranged are uniformly distributed in the environment
-- thereby contributing baselines with strong performance for future work on
multi-object rearrangement planning in partially observable settings.
- Abstract(参考訳): ハウスクリーニングから料理まで、多くの現実世界のタスクは、エージェントが特定のオブジェクトを適切なゴール状態に保つ必要があるマルチオブジェクト再配置問題として定式化することができる。
このような問題に対して,事前指定された目標状態,完全な操作とオブジェクト認識機能の提供,環境の静的マップなど,再配置すべきオブジェクトの初期位置が不明な設定に注目する。
我々の目標は,このような部分的可観測性の下で,家庭支援型知的エージェントが効率的に再配置を計画できるようにすることである。
これは、環境探索と再配置計画の間の効率的なトレードオフを必要としており、この問題の長期的性質のために困難である。
この問題を進展させるために,我々はまず,オブジェクト数やレセプタクル数,エージェント搬送能力,環境レイアウトなど様々な要因が,古典的手法による再配置の探索と計画に及ぼす影響を解析した。
次に,設計計画のためのモノリシックおよびモジュール型深層強化学習(drl)手法について検討した。
モノリシックDRL法は多目的再配置に必要な長期計画では成功しない。
その代わり、モジュラーグリーディアプローチは驚くほどうまく機能し、多目的再配置問題における部分可観測性を持つ計画の競争ベースラインとして現れる。
また、我々は、再配置が必要なオブジェクトが一様に環境に分散されているとき、我々の欲張りなモジュラーエージェントが経験的に最適であることを示します。
関連論文リスト
- Sequence-Based Plan Feasibility Prediction for Efficient Task and Motion
Planning [44.56909875875932]
具体的かつ可動的な障害を含むタスクでは、タスク・アンド・モーション・プランニング(TAMP)アルゴリズムが実行時の大半を、解決不可能な制約満足度問題の解決に費やしている。
我々は、初期状態、目標、および候補計画に基づいて計画の実現可能性を予測する新しいトランスフォーマーベースのアーキテクチャ、PIGINetを開発した。
PIGINetは計画の効率を大幅に改善し, 障害物のあるピック・アンド・プレイスの問題を平均80%削減する。
論文 参考訳(メタデータ) (2022-11-03T04:12:04Z) - Long-HOT: A Modular Hierarchical Approach for Long-Horizon Object
Transport [83.06265788137443]
我々は、時間的拡張ナビゲーションのための新しいオブジェクトトランスポートタスクと新しいモジュラーフレームワークを提案することで、長距離探査と航法を具現化する上で重要な課題に対処する。
私たちの最初の貢献は、深層探査と長期計画に焦点を当てた新しいLong-HOT環境の設計である。
重み付けされたフロンティアの助けを借りて探索を行うために,シーンのトポロジカルグラフを構築するモジュラー階層輸送ポリシー(HTP)を提案する。
論文 参考訳(メタデータ) (2022-10-28T05:30:49Z) - Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z) - Task Allocation for Multi-Robot Task and Motion Planning: a case for
Object Picking in Cluttered Workspaces [1.3535770763481902]
統合型マルチロボットタスクとモーションプランニング手法を提案する。
未知のオブジェクトの再配列を含むタスクを処理できる。
2つのフランカエミカマニピュレータのシミュレーション実験で実験を行った。
論文 参考訳(メタデータ) (2021-10-08T12:36:43Z) - Hierarchical Policy for Non-prehensile Multi-object Rearrangement with
Deep Reinforcement Learning and Monte Carlo Tree Search [30.31462739429364]
本稿では,非包括的多目的再構成のための分割と征服のための階層的ポリシーを提案する。
高レベルポリシーでは、モンテカルロ木探索は複数のオブジェクト間の最適な再配置シーケンスを効率的に探索する。
低レベルポリシーでは、ロボットは経路プリミティブの順序に従って経路を計画し、目標に1つずつ近づくためにオブジェクトを操作する。
論文 参考訳(メタデータ) (2021-09-18T17:24:37Z) - Predicting Stable Configurations for Semantic Placement of Novel Objects [37.18437299513799]
我々のゴールは、新しい環境における学習された意味的関係に従って、ロボットが未確認の物体を配置できるようにすることである。
我々は、未知のオブジェクトのセマンティック配置のための計画アルゴリズムと密に統合するために、モデルとトレーニングをゼロから構築する。
提案手法は,RGB-Dセンシングのみによる形状の異なるシーンにおける未知物体のセマンティック・アレンジメントのための動作計画を可能にする。
論文 参考訳(メタデータ) (2021-08-26T23:05:05Z) - Temporal Predictive Coding For Model-Based Planning In Latent Space [80.99554006174093]
時間的に予測可能な環境要素を符号化するために,時間的予測符号化を用いた情報理論的手法を提案する。
本稿では,DMControl タスクの背景を複雑な情報を含む自然なビデオに置き換える,標準的な DMControl タスクの挑戦的な修正について評価する。
論文 参考訳(メタデータ) (2021-06-14T04:31:15Z) - NeRP: Neural Rearrangement Planning for Unknown Objects [49.191284597526]
我々は,多段階のニューラルオブジェクト再構成計画のためのディープラーニングに基づくアプローチであるNeRP(Neural Rearrangement Planning)を提案する。
NeRPは、シミュレーションデータに基づいてトレーニングされ、現実世界に一般化される、これまで見たことのないオブジェクトで動作する。
論文 参考訳(メタデータ) (2021-06-02T17:56:27Z) - PackIt: A Virtual Environment for Geometric Planning [68.79816936618454]
PackItは、幾何学的計画を行う能力を評価し、潜在的に学習する仮想環境である。
進化的アルゴリズムを用いて,一組の難解なパッケージングタスクを構築した。
論文 参考訳(メタデータ) (2020-07-21T22:51:17Z) - Bottom-up mechanism and improved contract net protocol for the dynamic
task planning of heterogeneous Earth observation resources [61.75759893720484]
地球観測資源は、災害救助、被害評価、関連する領域においてますます不可欠になりつつある。
観測要求の変更や悪天候の発生、資源の失敗など、予測できない多くの要因は、スケジュールされた観測計画が実行不可能になる可能性がある。
不均質な地球観測資源の動的タスク計画を容易にするため、ボトムアップ分散協調フレームワークと改良された契約網を提案する。
論文 参考訳(メタデータ) (2020-07-13T03:51:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。