論文の概要: RackLay: Multi-Layer Layout Estimation for Warehouse Racks
- arxiv url: http://arxiv.org/abs/2103.09174v2
- Date: Wed, 17 Mar 2021 10:58:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-18 11:37:07.160909
- Title: RackLay: Multi-Layer Layout Estimation for Warehouse Racks
- Title(参考訳): RackLay: 倉庫ラックのマルチレイヤレイアウト推定
- Authors: Meher Shashwat Nigam, Avinash Prabhu, Anurag Sahu, Puru Gupta, Tanvi
Karandikar, N. Sai Shankar, Ravi Kiran Sarvadevabhatla, K. Madhava Krishna
- Abstract要約: 本稿では,単一の画像からリアルタイム棚配置推定を行うディープニューラルネットワークracklayを提案する。
racklayは、オブジェクトがポピュレートされたラック内の各棚のトップビューとフロントビューのレイアウトを見積もっている。
また、トップビューとフロントビューの融合により、考慮されたラックの計量自由空間推定などの3D推論アプリケーションを可能にすることも示しています。
- 参考スコア(独自算出の注目度): 17.937062635570268
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given a monocular colour image of a warehouse rack, we aim to predict the
bird's-eye view layout for each shelf in the rack, which we term as multi-layer
layout prediction. To this end, we present RackLay, a deep neural network for
real-time shelf layout estimation from a single image. Unlike previous layout
estimation methods, which provide a single layout for the dominant ground plane
alone, RackLay estimates the top-view and front-view layout for each shelf in
the considered rack populated with objects. RackLay's architecture and its
variants are versatile and estimate accurate layouts for diverse scenes
characterized by varying number of visible shelves in an image, large range in
shelf occupancy factor and varied background clutter. Given the extreme paucity
of datasets in this space and the difficulty involved in acquiring real data
from warehouses, we additionally release a flexible synthetic dataset
generation pipeline WareSynth which allows users to control the generation
process and tailor the dataset according to contingent application. The
ablations across architectural variants and comparison with strong prior
baselines vindicate the efficacy of RackLay as an apt architecture for the
novel problem of multi-layered layout estimation. We also show that fusing the
top-view and front-view enables 3D reasoning applications such as metric free
space estimation for the considered rack.
- Abstract(参考訳): 倉庫ラックの単眼カラー画像が与えられた場合,多層レイアウト予測と呼ぶラック内の各棚の鳥眼配置を予測することを目的としている。
そこで本研究では,単一の画像からリアルタイム棚配置推定を行うディープニューラルネットワークracklayを提案する。
従来のレイアウト推定手法とは異なり、racklayは、オブジェクトが配置されていると見なされるラック内の各棚の、トップビューとフロントビューのレイアウトを推定する。
RackLayのアーキテクチャとその変種は、画像中のさまざまな可視棚の数、棚の占有率の大きな範囲、様々な背景の乱れを特徴とする多様なシーンの、汎用的で正確なレイアウトを推定する。
この領域におけるデータセットの極端なポーシティと、倉庫からの実データを取得することの難しさを考えると、私たちはさらに柔軟な合成データセット生成パイプラインであるwaresynthをリリースします。
アーキテクチャの変種間のアブレーションと強力な先行ベースラインとの比較は、多層レイアウト推定の新たな問題に対するaptアーキテクチャとしてのracklayの有効性を証明している。
また、トップビューとフロントビューを融合させることで、検討したラックに対する計量自由空間推定などの3次元推論が可能であることを示す。
関連論文リスト
- 360 Layout Estimation via Orthogonal Planes Disentanglement and
Multi-view Geometric Consistency Perception [60.23832277827669]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元する傾向がある。
水平深度と比表現に適した教師なし適応手法を提案する。
また,決定レベルのレイアウト解析のための最適化手法と,特徴レベルのマルチビューアグリゲーションのための1次元コストボリューム構築手法も導入する。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - OccNeRF: Self-Supervised Multi-Camera Occupancy Prediction with Neural
Radiance Fields [80.35807140179736]
自己監督型マルチカメラ占有率予測のためのOccNeRF法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成する。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - iBARLE: imBalance-Aware Room Layout Estimation [54.819085005591894]
ルームレイアウト推定は、1つのパノラマからレイアウトを予測する。
実際のデータセットには、レイアウトの複雑さの次元、カメラの位置、シーンの外観の変化など、大きな不均衡がある。
これらの問題に対処するために, imBalance-Aware Room Layout Estimation (iBARLE) フレームワークを提案する。
iBARLEは、(1)外観変化生成(AVG)モジュール、(2)複合構造混合(CSMix)モジュール、(3)勾配に基づくレイアウト目的関数からなる。
論文 参考訳(メタデータ) (2023-08-29T06:20:36Z) - Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image
Generation [150.61390274654968]
本研究では,空間制御の4つの分野(数,位置,サイズ,形状)について,レイアウト誘導画像生成のための診断ベンチマークを提案する。
次に,新しいベースラインであるIterInpaintを提案する。
本研究はIterInpaintに関する総合的アブレーション研究であり,訓練作業率,作物・ペースト対リペイント,世代順等について述べる。
論文 参考訳(メタデータ) (2023-04-13T16:58:33Z) - From Semi-supervised to Omni-supervised Room Layout Estimation Using
Point Clouds [21.877157385576904]
ポイントクラウド(PC)を用いた部屋レイアウト推定は、アノテーションの難しさにより、データ不足に悩まされている。
クワッドとPC間のハイブリッド距離尺度の分布を2成分に分解するオンライン擬似ラベル抽出アルゴリズムを提案する。
驚くべきことに、このフレームワークは、完全に教師された設定でも機能し、ScanNetベンチマークで新しいSOTAを達成する。
論文 参考訳(メタデータ) (2023-01-31T18:58:41Z) - MVRackLay: Monocular Multi-View Layout Estimation for Warehouse Racks
and Shelves [8.845291721126825]
MVRackLayは、ラック内の棚のレイアウトに対応する多層レイアウトを推定する。
最小限の努力で、そのような出力は棚の上のラック、棚、オブジェクトの3Dレンダリングに変換される。
MVRackLayは、平均IoUとmAPのメトリクスで定量化され、レイアウト精度において、単一ビューのRackLayよりも優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2022-11-30T10:32:04Z) - Self-supervised 360$^{\circ}$ Room Layout Estimation [20.062713286961326]
ラベル付きデータを使わずにパノラマ的な部屋配置推定モデルを訓練するための,最初の自己教師方式を提案する。
弊社のアプローチでは、データ共有シナリオとアクティブラーニングにおける有望なソリューションも示しています。
論文 参考訳(メタデータ) (2022-03-30T04:58:07Z) - RoomStructNet: Learning to Rank Non-Cuboidal Room Layouts From Single
View [7.427006214471801]
そこで本研究では,部屋のレイアウトを単一画像から推定する手法を提案する。
提案手法では,最適化を使わずに最終的なレイアウトを推定するために,追加のランキング関数を学習する。
提案手法は,主に立方体配置を持つ標準データセットの最先端結果を示すとともに,非立方体レイアウトを持つ部屋を含むデータセット上でも良好に動作することを示す。
論文 参考訳(メタデータ) (2021-10-01T20:42:49Z) - LED2-Net: Monocular 360 Layout Estimation via Differentiable Depth
Rendering [59.63979143021241]
パノラマの地平線上での深度予測問題として360度レイアウト推定のタスクを定式化する。
レイアウトから深度予測への変換を区別できるように、差分可能な深度レンダリング手順を提案します。
提案手法は,360 レイアウトのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-01T15:48:41Z) - SSLayout360: Semi-Supervised Indoor Layout Estimation from 360-Degree
Panorama [0.0]
ラベル付きデータとラベルなしデータを組み合わせて,ルームコーナーと境界の表現を学習する最初のアプローチを提案する。
提案手法は,20のラベル付き例を用いて,複雑な屋内シーンのレイアウト推定を推し進めることができる。
論文 参考訳(メタデータ) (2021-03-25T09:19:13Z) - Shelf-Supervised Mesh Prediction in the Wild [54.01373263260449]
本研究では,物体の3次元形状とポーズを1つの画像から推定する学習手法を提案する。
まず、カメラのポーズとともに、標準フレーム内の体積表現を推定する。
粗い体積予測はメッシュベースの表現に変換され、予測されたカメラフレームでさらに洗練される。
論文 参考訳(メタデータ) (2021-02-11T18:57:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。