論文の概要: GOPT: Generalizable Online 3D Bin Packing via Transformer-based Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2409.05344v2
- Date: Thu, 12 Sep 2024 08:49:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-02 15:50:44.789765
- Title: GOPT: Generalizable Online 3D Bin Packing via Transformer-based Deep Reinforcement Learning
- Title(参考訳): GOPT: Transformer-based Deep Reinforcement Learningによる汎用オンライン3Dバインディング
- Authors: Heng Xiong, Changrong Guo, Jian Peng, Kai Ding, Wenjie Chen, Xuchong Qiu, Long Bai, Jianfeng Xu,
- Abstract要約: GOPTは、Transformer-based Deep reinforcement Learning (DRL)による汎用的なオンライン3D Bin Packingアプローチである。
そこで本研究では,商品とビンの特徴を融合したパッキングトランスフォーマーを提案し,パッケージ内のアイテムと利用可能なサブ空間との間の空間的相関を同定する。
我々は広範な実験を行い、GOPTがベースラインに対して優れた性能を発揮することを実証すると同時に、優れた一般化能力を示す。
- 参考スコア(独自算出の注目度): 12.801743977971434
- License:
- Abstract: Robotic object packing has broad practical applications in the logistics and automation industry, often formulated by researchers as the online 3D Bin Packing Problem (3D-BPP). However, existing DRL-based methods primarily focus on enhancing performance in limited packing environments while neglecting the ability to generalize across multiple environments characterized by different bin dimensions. To this end, we propose GOPT, a generalizable online 3D Bin Packing approach via Transformer-based deep reinforcement learning (DRL). First, we design a Placement Generator module to yield finite subspaces as placement candidates and the representation of the bin. Second, we propose a Packing Transformer, which fuses the features of the items and bin, to identify the spatial correlation between the item to be packed and available sub-spaces within the bin. Coupling these two components enables GOPT's ability to perform inference on bins of varying dimensions. We conduct extensive experiments and demonstrate that GOPT not only achieves superior performance against the baselines, but also exhibits excellent generalization capabilities. Furthermore, the deployment with a robot showcases the practical applicability of our method in the real world. The source code will be publicly available at https://github.com/Xiong5Heng/GOPT.
- Abstract(参考訳): ロボット・オブジェクト・パッキングはロジスティクスとオートメーション産業で広く応用されており、オンライン3D Bin Packing Problem (3D-BPP) と呼ばれる研究者によってしばしば定式化されている。
しかし、既存のDRLベースの手法は、主に制限された梱包環境における性能向上に重点を置いており、異なるビン次元で特徴づけられる複数の環境をまたいで一般化する能力は無視している。
そこで我々は,Transformer-based Deep reinforcement learning (DRL) を用いた汎用的なオンライン3D Bin PackingアプローチであるGOPTを提案する。
まず、配置候補として有限部分空間を出力する配置生成モジュールと、ビンの表現を設計する。
第2に,対象物とビンの特徴を融合したパッキングトランスフォーマーを提案し,充填対象物とビン内の利用可能な部分空間との間の空間的相関を同定する。
これら2つのコンポーネントを結合することで、GOPTは様々な次元のビンで推論を行うことができる。
我々は広範な実験を行い、GOPTがベースラインに対して優れた性能を発揮するだけでなく、優れた一般化能力を示すことを示した。
さらに,ロボットによる展開により,実世界における本手法の適用性を示す。
ソースコードはhttps://github.com/Xiong5Heng/GOPTで公開されている。
関連論文リスト
- Towards Cross-device and Training-free Robotic Grasping in 3D Open World [20.406334587479623]
本稿では,オープンワールドシナリオにおいて,学習を必要とせずにオブジェクト把握タスクを実行できる新しいパイプラインを提案する。
本稿では,セグメンテーション精度を向上し,未確認オブジェクトをクラスタ化およびローカライズする機能を有する,学習不要なバイナリクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-27T08:23:28Z) - Neural Packing: from Visual Sensing to Reinforcement Learning [24.35678534893451]
本稿では,3DでTAP(Transport-and-packing)問題を解決するための新しい学習フレームワークを提案する。
RGBDセンシングと認識による入力オブジェクトの部分的な観察から、ロボットモーション計画による最終ボックス配置に至るまで、完全なソリューションパイプラインを構成し、ターゲットコンテナ内のコンパクトパッキングに到達する。
論文 参考訳(メタデータ) (2023-10-17T02:42:54Z) - Convolutional Occupancy Models for Dense Packing of Complex, Novel
Objects [75.54599721349037]
実世界における密包装のための既成の計画手法と容易に組み合わせることができる完全畳み込み形状完備モデルF-CONを提案する。
シミュレーションデータセットであるCOB-3D-v2もリリースしています。
最後に、F-CONと現実世界のピック・アンド・プレイス・システムを備え、散らばったシーンで複雑で見えない物体を密集したパッキングを実演する。
論文 参考訳(メタデータ) (2023-07-31T19:08:16Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - Hierarchical Point Attention for Indoor 3D Object Detection [111.04397308495618]
本研究は、点ベース変圧器検出器の汎用階層設計として、2つの新しい注意操作を提案する。
まず、よりきめ細かい特徴学習を可能にするために、シングルスケールの入力機能からマルチスケールトークンを構築するマルチスケール注意(MS-A)を提案する。
第2に,適応型アテンション領域を持つサイズ適応型ローカルアテンション(Local-A)を提案する。
論文 参考訳(メタデータ) (2023-01-06T18:52:12Z) - Planning Irregular Object Packing via Hierarchical Reinforcement
Learning [85.64313062912491]
本研究では,不規則物体のパッケージングシーケンスと配置を計画するための階層的強化学習手法を提案する。
我々の手法は、不規則なオブジェクトの最先端のパッキング方法よりも、より少ない時間でより多くのオブジェクトをパックできることを示す。
論文 参考訳(メタデータ) (2022-11-17T07:16:37Z) - Online 3D Bin Packing Reinforcement Learning Solution with Buffer [1.8060107352742993]
性能向上のための3D-BPPソリューションのための新しい強化学習フレームワークを提案する。
一般的なアルゴリズムAlphaGoに適応したモデルベースRL法を実装した。
私たちの適応はシングルプレイヤーとスコアベースの環境で動作することができます。
論文 参考訳(メタデータ) (2022-08-15T11:28:20Z) - Learning Practically Feasible Policies for Online 3D Bin Packing [36.33774915391967]
Online 3D Bin Packing Problemは、従来のBin Packing Problemの難解だが実用的には有用である。
オンライン3D-BPPはマルコフ決定過程(MDP)として自然に定式化できる
我々は,このMDPを制約された行動空間で解くために,特に政治的アクター批判的枠組みの深層強化学習を採用する。
論文 参考訳(メタデータ) (2021-08-31T08:37:58Z) - Habitat 2.0: Training Home Assistants to Rearrange their Habitat [122.54624752876276]
インタラクティブな3D環境で仮想ロボットを訓練するためのシミュレーションプラットフォームHabitat 2.0(H2.0)を紹介する。
エンボディされたAIスタックのすべてのレベル – データ、シミュレーション、ベンチマークタスク – にコントリビューションを行います。
論文 参考訳(メタデータ) (2021-06-28T05:42:15Z) - A Generalized Reinforcement Learning Algorithm for Online 3D Bin-Packing [7.79020719611004]
本稿では,オンライン3次元ビンパッキング問題の解法としてDeep Reinforcement Learning (Deep RL)アルゴリズムを提案する。
その焦点は、ロボットのローディングアームで物理的に実装できる意思決定を作ることだ。
実験的な競合比と容積効率の観点から,RL法は最先端のオンラインビンパッキングよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-07-01T13:02:04Z) - GSTO: Gated Scale-Transfer Operation for Multi-Scale Feature Learning in
Pixel Labeling [92.90448357454274]
本稿では,空間教師付き機能を他のスケールに適切に移行するためのGated Scale-Transfer Operation (GSTO)を提案する。
GSTOをHRNetにプラグインすることで、ピクセルラベリングの強力なバックボーンが得られます。
実験の結果,GSTOはマルチスケール機能アグリゲーションモジュールの性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2020-05-27T13:46:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。