論文の概要: A Generalized Reinforcement Learning Algorithm for Online 3D Bin-Packing
- arxiv url: http://arxiv.org/abs/2007.00463v1
- Date: Wed, 1 Jul 2020 13:02:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 23:11:47.463269
- Title: A Generalized Reinforcement Learning Algorithm for Online 3D Bin-Packing
- Title(参考訳): オンライン3次元ビンパッキングのための一般化強化学習アルゴリズム
- Authors: Richa Verma, Aniruddha Singhal, Harshad Khadilkar, Ansuma Basumatary,
Siddharth Nayak, Harsh Vardhan Singh, Swagat Kumar, Rajesh Sinha
- Abstract要約: 本稿では,オンライン3次元ビンパッキング問題の解法としてDeep Reinforcement Learning (Deep RL)アルゴリズムを提案する。
その焦点は、ロボットのローディングアームで物理的に実装できる意思決定を作ることだ。
実験的な競合比と容積効率の観点から,RL法は最先端のオンラインビンパッキングよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 7.79020719611004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a Deep Reinforcement Learning (Deep RL) algorithm for solving the
online 3D bin packing problem for an arbitrary number of bins and any bin size.
The focus is on producing decisions that can be physically implemented by a
robotic loading arm, a laboratory prototype used for testing the concept. The
problem considered in this paper is novel in two ways. First, unlike the
traditional 3D bin packing problem, we assume that the entire set of objects to
be packed is not known a priori. Instead, a fixed number of upcoming objects is
visible to the loading system, and they must be loaded in the order of arrival.
Second, the goal is not to move objects from one point to another via a
feasible path, but to find a location and orientation for each object that
maximises the overall packing efficiency of the bin(s). Finally, the learnt
model is designed to work with problem instances of arbitrary size without
retraining. Simulation results show that the RL-based method outperforms
state-of-the-art online bin packing heuristics in terms of empirical
competitive ratio and volume efficiency.
- Abstract(参考訳): 任意の数のビンと任意のビンサイズのオンライン3dビンパッキング問題を解決するための深層強化学習(deep rl)アルゴリズムを提案する。
その焦点は、そのコンセプトをテストするための実験室のプロトタイプであるロボットの積み込みアームによって物理的に実装できる意思決定を作ることにある。
本論文の問題点は2つの点で斬新である。
第一に、従来の3D bin パッケージング問題とは異なり、パッケージングされるオブジェクトの集合全体がプリオリではないと仮定する。
代わりに、固定された数のオブジェクトがロードシステムに表示され、到着順にロードされなければならない。
第二に、目標は、実現可能なパスを介してオブジェクトをあるポイントから別のポイントに移動するのではなく、bin(s)の全体的なパッキング効率を最大化する各オブジェクトの位置と方向を見つけることである。
最後に、学習モデルは、任意のサイズの問題インスタンスで再トレーニングすることなく動作するように設計されている。
シミュレーションの結果,rlベースの手法は,経験的競合比とボリューム効率の点で,最先端のオンラインビンパッキングヒューリスティックよりも優れていることがわかった。
関連論文リスト
- General Geometry-aware Weakly Supervised 3D Object Detection [62.26729317523975]
RGB画像と関連する2Dボックスから3Dオブジェクト検出器を学習するための統合フレームワークを開発した。
KITTIとSUN-RGBDデータセットの実験により,本手法は驚くほど高品質な3次元境界ボックスを2次元アノテーションで生成することを示した。
論文 参考訳(メタデータ) (2024-07-18T17:52:08Z) - Neural Packing: from Visual Sensing to Reinforcement Learning [24.35678534893451]
本稿では,3DでTAP(Transport-and-packing)問題を解決するための新しい学習フレームワークを提案する。
RGBDセンシングと認識による入力オブジェクトの部分的な観察から、ロボットモーション計画による最終ボックス配置に至るまで、完全なソリューションパイプラインを構成し、ターゲットコンテナ内のコンパクトパッキングに到達する。
論文 参考訳(メタデータ) (2023-10-17T02:42:54Z) - Learning Physically Realizable Skills for Online Packing of General 3D
Shapes [41.27652080050046]
本研究では,不規則な3次元形状に対するオンラインパッキングスキルの学習課題について検討する。
目標は、任意の形状の3Dオブジェクトの連続を指定された容器に連続的に移動させることである。
我々は、物理力学と配置の制約を含む物理的実現性を考慮に入れている。
論文 参考訳(メタデータ) (2022-12-05T08:23:39Z) - Planning Irregular Object Packing via Hierarchical Reinforcement
Learning [85.64313062912491]
本研究では,不規則物体のパッケージングシーケンスと配置を計画するための階層的強化学習手法を提案する。
我々の手法は、不規則なオブジェクトの最先端のパッキング方法よりも、より少ない時間でより多くのオブジェクトをパックできることを示す。
論文 参考訳(メタデータ) (2022-11-17T07:16:37Z) - OPA-3D: Occlusion-Aware Pixel-Wise Aggregation for Monocular 3D Object
Detection [51.153003057515754]
OPA-3Dは、Occlusion-Aware Pixel-Wise Aggregationネットワークである。
密集した風景深度と、奥行きのある箱残量と物の境界箱を共同で推定する。
メインカーのカテゴリーでは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-02T14:19:13Z) - Online 3D Bin Packing Reinforcement Learning Solution with Buffer [1.8060107352742993]
性能向上のための3D-BPPソリューションのための新しい強化学習フレームワークを提案する。
一般的なアルゴリズムAlphaGoに適応したモデルベースRL法を実装した。
私たちの適応はシングルプレイヤーとスコアベースの環境で動作することができます。
論文 参考訳(メタデータ) (2022-08-15T11:28:20Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - Learning Practically Feasible Policies for Online 3D Bin Packing [36.33774915391967]
Online 3D Bin Packing Problemは、従来のBin Packing Problemの難解だが実用的には有用である。
オンライン3D-BPPはマルコフ決定過程(MDP)として自然に定式化できる
我々は,このMDPを制約された行動空間で解くために,特に政治的アクター批判的枠組みの深層強化学習を採用する。
論文 参考訳(メタデータ) (2021-08-31T08:37:58Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Factor Graph based 3D Multi-Object Tracking in Point Clouds [8.411514688735183]
明示的および固定的な代入に依存しない新しい最適化に基づくアプローチを提案する。
我々は、実世界のKITTI追跡データセットの性能を実証し、多くの最先端アルゴリズムよりも優れた結果を得る。
論文 参考訳(メタデータ) (2020-08-12T13:34:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。