論文の概要: Planning Irregular Object Packing via Hierarchical Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2211.09382v1
- Date: Thu, 17 Nov 2022 07:16:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 17:14:38.841473
- Title: Planning Irregular Object Packing via Hierarchical Reinforcement
Learning
- Title(参考訳): 階層的強化学習による不規則物体のパッケージング計画
- Authors: Sichao Huang, Ziwei Wang, Jie Zhou, and Jiwen Lu
- Abstract要約: 本研究では,不規則物体のパッケージングシーケンスと配置を計画するための階層的強化学習手法を提案する。
我々の手法は、不規則なオブジェクトの最先端のパッキング方法よりも、より少ない時間でより多くのオブジェクトをパックできることを示す。
- 参考スコア(独自算出の注目度): 85.64313062912491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object packing by autonomous robots is an im-portant challenge in warehouses
and logistics industry. Most conventional data-driven packing planning
approaches focus on regular cuboid packing, which are usually heuristic and
limit the practical use in realistic applications with everyday objects. In
this paper, we propose a deep hierarchical reinforcement learning approach to
simultaneously plan packing sequence and placement for irregular object
packing. Specifically, the top manager network infers packing sequence from six
principal view heightmaps of all objects, and then the bottom worker network
receives heightmaps of the next object to predict the placement position and
orientation. The two networks are trained hierarchically in a self-supervised
Q-Learning framework, where the rewards are provided by the packing results
based on the top height , object volume and placement stability in the box. The
framework repeats sequence and placement planning iteratively until all objects
have been packed into the box or no space is remained for unpacked items. We
compare our approach with existing robotic packing methods for irregular
objects in a physics simulator. Experiments show that our approach can pack
more objects with less time cost than the state-of-the-art packing methods of
irregular objects. We also implement our packing plan with a robotic
manipulator to show the generalization ability in the real world.
- Abstract(参考訳): 自律型ロボットによるオブジェクトパッキングは、倉庫や物流業界にとって重要な課題だ。
従来のデータ駆動型パッキング計画手法は、通常のカブイドパッキングに重点を置いており、通常はヒューリスティックであり、日常的なオブジェクトで現実的なアプリケーションでの使用を制限する。
本稿では,不規則オブジェクトパッキングのパッキングシーケンスと配置を同時に計画する,階層的強化学習手法を提案する。
具体的には、トップマネージャネットワークは、すべてのオブジェクトの6つのプリンシパルビューハイトマップからパッキングシーケンスを推論し、下ワーカネットワークは次のオブジェクトのハイトマップを受け取り、配置位置と向きを予測する。
この2つのネットワークは、自己教師型Qラーニングフレームワークで階層的に訓練され、箱の上部高さ、物体体積、配置安定性に基づいて、梱包結果によって報酬が提供される。
フレームワークは、すべてのオブジェクトがボックスに詰め込まれるか、アンパックアイテムのスペースが残らないまで、反復的にシーケンスと配置計画を繰り返します。
物理シミュレータにおける不規則物体に対する既存のロボットパッキング手法との比較を行った。
実験により, 不規則な物体の最先端の包装法よりも, 低コストでより多くの物体を梱包できることが示された。
また,実世界の一般化能力を示すロボットマニピュレータを用いて,パッケージング計画を実装した。
関連論文リスト
- Embodied Instruction Following in Unknown Environments [66.60163202450954]
未知環境における複雑なタスクに対するEIF(Embodied instruction following)法を提案する。
我々は,ハイレベルなタスクプランナと低レベルな探索コントローラを含む,階層的な具体化命令に従うフレームワークを構築した。
タスクプランナに対しては、タスク完了プロセスと既知の視覚的手がかりに基づいて、人間の目標達成のための実行可能なステップバイステッププランを生成する。
論文 参考訳(メタデータ) (2024-06-17T17:55:40Z) - Convolutional Occupancy Models for Dense Packing of Complex, Novel
Objects [75.54599721349037]
実世界における密包装のための既成の計画手法と容易に組み合わせることができる完全畳み込み形状完備モデルF-CONを提案する。
シミュレーションデータセットであるCOB-3D-v2もリリースしています。
最後に、F-CONと現実世界のピック・アンド・プレイス・システムを備え、散らばったシーンで複雑で見えない物体を密集したパッキングを実演する。
論文 参考訳(メタデータ) (2023-07-31T19:08:16Z) - PlanT: Explainable Planning Transformers via Object-Level
Representations [64.93938686101309]
PlanTは、自動運転のコンテキストにおける計画のための新しいアプローチである。
PlanTは、コンパクトなオブジェクトレベルの入力表現を持つ模倣学習に基づいている。
この結果から,PlanTは幾何学的に距離をおいても,現場で最も関連性の高い物体に焦点を合わせることが可能であることが示唆された。
論文 参考訳(メタデータ) (2022-10-25T17:59:46Z) - SafePicking: Learning Safe Object Extraction via Object-Level Mapping [19.502587411252946]
本稿では,オブジェクトレベルのマッピングと学習に基づくモーションプランニングを統合したSafePickingを提案する。
計画は、予測されたポーズの観測を受信する深いQネットワークと、動き軌跡を出力する深さに基づく高さマップを学習することによって行われる。
この結果から,ポーズの観察と深度感の融合により,モデルの性能とロバスト性が向上することが示唆された。
論文 参考訳(メタデータ) (2022-02-11T18:55:10Z) - Long-Horizon Manipulation of Unknown Objects via Task and Motion
Planning with Estimated Affordances [26.082034134908785]
操作可能なオブジェクトの集合に関する事前知識がなくても,タスク・アンド・モーション・プランナが知的行動の計画に利用できることを示す。
この戦略により、単一のシステムが様々な実世界のマルチステップ操作タスクを実行できることを実証する。
論文 参考訳(メタデータ) (2021-08-09T16:13:47Z) - A Long Horizon Planning Framework for Manipulating Rigid Pointcloud
Objects [25.428781562909606]
本稿では,剛体物体の操作に伴う長期計画問題の解決のための枠組みを提案する。
提案手法はオブジェクトサブゴールの空間における計画であり,ロボットとオブジェクトの相互作用のダイナミクスに関する推論からプランナーを解放する。
論文 参考訳(メタデータ) (2020-11-16T18:59:33Z) - PackIt: A Virtual Environment for Geometric Planning [68.79816936618454]
PackItは、幾何学的計画を行う能力を評価し、潜在的に学習する仮想環境である。
進化的アルゴリズムを用いて,一組の難解なパッケージングタスクを構築した。
論文 参考訳(メタデータ) (2020-07-21T22:51:17Z) - A Generalized Reinforcement Learning Algorithm for Online 3D Bin-Packing [7.79020719611004]
本稿では,オンライン3次元ビンパッキング問題の解法としてDeep Reinforcement Learning (Deep RL)アルゴリズムを提案する。
その焦点は、ロボットのローディングアームで物理的に実装できる意思決定を作ることだ。
実験的な競合比と容積効率の観点から,RL法は最先端のオンラインビンパッキングよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-07-01T13:02:04Z) - Latent Space Roadmap for Visual Action Planning of Deformable and Rigid
Object Manipulation [74.88956115580388]
プランニングは、イメージを埋め込んだ低次元の潜在状態空間で行われる。
我々のフレームワークは2つの主要なコンポーネントで構成されており、画像のシーケンスとして視覚的な計画を生成するビジュアル・フォレスト・モジュール(VFM)と、それら間のアクションを予測するアクション・プロポーザル・ネットワーク(APN)である。
論文 参考訳(メタデータ) (2020-03-19T18:43:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。