論文の概要: RackLay: Multi-Layer Layout Estimation for Warehouse Racks
- arxiv url: http://arxiv.org/abs/2103.09174v2
- Date: Wed, 17 Mar 2021 10:58:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-18 11:37:07.160909
- Title: RackLay: Multi-Layer Layout Estimation for Warehouse Racks
- Title(参考訳): RackLay: 倉庫ラックのマルチレイヤレイアウト推定
- Authors: Meher Shashwat Nigam, Avinash Prabhu, Anurag Sahu, Puru Gupta, Tanvi
Karandikar, N. Sai Shankar, Ravi Kiran Sarvadevabhatla, K. Madhava Krishna
- Abstract要約: 本稿では,単一の画像からリアルタイム棚配置推定を行うディープニューラルネットワークracklayを提案する。
racklayは、オブジェクトがポピュレートされたラック内の各棚のトップビューとフロントビューのレイアウトを見積もっている。
また、トップビューとフロントビューの融合により、考慮されたラックの計量自由空間推定などの3D推論アプリケーションを可能にすることも示しています。
- 参考スコア(独自算出の注目度): 17.937062635570268
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given a monocular colour image of a warehouse rack, we aim to predict the
bird's-eye view layout for each shelf in the rack, which we term as multi-layer
layout prediction. To this end, we present RackLay, a deep neural network for
real-time shelf layout estimation from a single image. Unlike previous layout
estimation methods, which provide a single layout for the dominant ground plane
alone, RackLay estimates the top-view and front-view layout for each shelf in
the considered rack populated with objects. RackLay's architecture and its
variants are versatile and estimate accurate layouts for diverse scenes
characterized by varying number of visible shelves in an image, large range in
shelf occupancy factor and varied background clutter. Given the extreme paucity
of datasets in this space and the difficulty involved in acquiring real data
from warehouses, we additionally release a flexible synthetic dataset
generation pipeline WareSynth which allows users to control the generation
process and tailor the dataset according to contingent application. The
ablations across architectural variants and comparison with strong prior
baselines vindicate the efficacy of RackLay as an apt architecture for the
novel problem of multi-layered layout estimation. We also show that fusing the
top-view and front-view enables 3D reasoning applications such as metric free
space estimation for the considered rack.
- Abstract(参考訳): 倉庫ラックの単眼カラー画像が与えられた場合,多層レイアウト予測と呼ぶラック内の各棚の鳥眼配置を予測することを目的としている。
そこで本研究では,単一の画像からリアルタイム棚配置推定を行うディープニューラルネットワークracklayを提案する。
従来のレイアウト推定手法とは異なり、racklayは、オブジェクトが配置されていると見なされるラック内の各棚の、トップビューとフロントビューのレイアウトを推定する。
RackLayのアーキテクチャとその変種は、画像中のさまざまな可視棚の数、棚の占有率の大きな範囲、様々な背景の乱れを特徴とする多様なシーンの、汎用的で正確なレイアウトを推定する。
この領域におけるデータセットの極端なポーシティと、倉庫からの実データを取得することの難しさを考えると、私たちはさらに柔軟な合成データセット生成パイプラインであるwaresynthをリリースします。
アーキテクチャの変種間のアブレーションと強力な先行ベースラインとの比較は、多層レイアウト推定の新たな問題に対するaptアーキテクチャとしてのracklayの有効性を証明している。
また、トップビューとフロントビューを融合させることで、検討したラックに対する計量自由空間推定などの3次元推論が可能であることを示す。
関連論文リスト
- Self-training Room Layout Estimation via Geometry-aware Ray-casting [27.906107629563852]
本研究では,未表示のシーンにおける室内レイアウト推定モデルのための幾何学的自己学習フレームワークを提案する。
提案手法では,異なる視点からの複数の推定値の集計にレイキャストの定式化を用いる。
論文 参考訳(メタデータ) (2024-07-21T03:25:55Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - iBARLE: imBalance-Aware Room Layout Estimation [54.819085005591894]
ルームレイアウト推定は、1つのパノラマからレイアウトを予測する。
実際のデータセットには、レイアウトの複雑さの次元、カメラの位置、シーンの外観の変化など、大きな不均衡がある。
これらの問題に対処するために, imBalance-Aware Room Layout Estimation (iBARLE) フレームワークを提案する。
iBARLEは、(1)外観変化生成(AVG)モジュール、(2)複合構造混合(CSMix)モジュール、(3)勾配に基づくレイアウト目的関数からなる。
論文 参考訳(メタデータ) (2023-08-29T06:20:36Z) - SGAligner : 3D Scene Alignment with Scene Graphs [84.01002998166145]
3Dシーングラフの構築は、いくつかの具体的AIアプリケーションのためのシーン表現のトピックとして登場した。
オーバーラップ可能な3次元シーングラフのペアをゼロから部分的に整列させるという基本的な問題に着目する。
そこで我々はSGAlignerを提案する。SGAlignerは3次元シーングラフのペアを組合わせるための最初の方法であり、その組込みシナリオに対して堅牢である。
論文 参考訳(メタデータ) (2023-04-28T14:39:22Z) - Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image Generation [147.81509219686419]
本研究では,空間制御の4つの分野(数,位置,サイズ,形状)について,レイアウト誘導画像生成のための診断ベンチマークを提案する。
次に,新しいベースラインであるIterInpaintを提案する。
本研究はIterInpaintに関する総合的アブレーション研究である。
論文 参考訳(メタデータ) (2023-04-13T16:58:33Z) - MVRackLay: Monocular Multi-View Layout Estimation for Warehouse Racks
and Shelves [8.845291721126825]
MVRackLayは、ラック内の棚のレイアウトに対応する多層レイアウトを推定する。
最小限の努力で、そのような出力は棚の上のラック、棚、オブジェクトの3Dレンダリングに変換される。
MVRackLayは、平均IoUとmAPのメトリクスで定量化され、レイアウト精度において、単一ビューのRackLayよりも優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2022-11-30T10:32:04Z) - Self-supervised 360$^{\circ}$ Room Layout Estimation [20.062713286961326]
ラベル付きデータを使わずにパノラマ的な部屋配置推定モデルを訓練するための,最初の自己教師方式を提案する。
弊社のアプローチでは、データ共有シナリオとアクティブラーニングにおける有望なソリューションも示しています。
論文 参考訳(メタデータ) (2022-03-30T04:58:07Z) - RoomStructNet: Learning to Rank Non-Cuboidal Room Layouts From Single
View [7.427006214471801]
そこで本研究では,部屋のレイアウトを単一画像から推定する手法を提案する。
提案手法では,最適化を使わずに最終的なレイアウトを推定するために,追加のランキング関数を学習する。
提案手法は,主に立方体配置を持つ標準データセットの最先端結果を示すとともに,非立方体レイアウトを持つ部屋を含むデータセット上でも良好に動作することを示す。
論文 参考訳(メタデータ) (2021-10-01T20:42:49Z) - LED2-Net: Monocular 360 Layout Estimation via Differentiable Depth
Rendering [59.63979143021241]
パノラマの地平線上での深度予測問題として360度レイアウト推定のタスクを定式化する。
レイアウトから深度予測への変換を区別できるように、差分可能な深度レンダリング手順を提案します。
提案手法は,360 レイアウトのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-01T15:48:41Z) - SSLayout360: Semi-Supervised Indoor Layout Estimation from 360-Degree
Panorama [0.0]
ラベル付きデータとラベルなしデータを組み合わせて,ルームコーナーと境界の表現を学習する最初のアプローチを提案する。
提案手法は,20のラベル付き例を用いて,複雑な屋内シーンのレイアウト推定を推し進めることができる。
論文 参考訳(メタデータ) (2021-03-25T09:19:13Z) - Shelf-Supervised Mesh Prediction in the Wild [54.01373263260449]
本研究では,物体の3次元形状とポーズを1つの画像から推定する学習手法を提案する。
まず、カメラのポーズとともに、標準フレーム内の体積表現を推定する。
粗い体積予測はメッシュベースの表現に変換され、予測されたカメラフレームでさらに洗練される。
論文 参考訳(メタデータ) (2021-02-11T18:57:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。