論文の概要: Parcel3D: Shape Reconstruction from Single RGB Images for Applications
in Transportation Logistics
- arxiv url: http://arxiv.org/abs/2304.08994v1
- Date: Tue, 18 Apr 2023 13:55:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 14:31:07.337298
- Title: Parcel3D: Shape Reconstruction from Single RGB Images for Applications
in Transportation Logistics
- Title(参考訳): Parcel3D:単一RGB画像からの形状再構成による輸送ロジスティックスへの応用
- Authors: Alexander Naumann, Felix Hertlein, Laura D\"orr, Kai Furmans
- Abstract要約: 本研究では,ロジスティクスにおける損傷の防止と改ざん検出に焦点をあて,損傷の可能性のあるパーセルの3次元形状復元問題に取り組む。
本稿では,Google Scanned Objects (GSO)データセットに基づく新しい合成データセットParcel3Dを提案する。
本稿では,3次元境界ボックスと反復メッシュリファインメントを併用した,CubeRefine R-CNNという新しいアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 62.997667081978825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We focus on enabling damage and tampering detection in logistics and tackle
the problem of 3D shape reconstruction of potentially damaged parcels. As input
we utilize single RGB images, which corresponds to use-cases where only simple
handheld devices are available, e.g. for postmen during delivery or clients on
delivery. We present a novel synthetic dataset, named Parcel3D, that is based
on the Google Scanned Objects (GSO) dataset and consists of more than 13,000
images of parcels with full 3D annotations. The dataset contains intact, i.e.
cuboid-shaped, parcels and damaged parcels, which were generated in
simulations. We work towards detecting mishandling of parcels by presenting a
novel architecture called CubeRefine R-CNN, which combines estimating a 3D
bounding box with an iterative mesh refinement. We benchmark our approach on
Parcel3D and an existing dataset of cuboid-shaped parcels in real-world
scenarios. Our results show, that while training on Parcel3D enables transfer
to the real world, enabling reliable deployment in real-world scenarios is
still challenging. CubeRefine R-CNN yields competitive performance in terms of
Mesh AP and is the only model that directly enables deformation assessment by
3D mesh comparison and tampering detection by comparing viewpoint invariant
parcel side surface representations. Dataset and code are available at
https://a-nau.github.io/parcel3d.
- Abstract(参考訳): 我々は,ロジスティクスにおける損傷とタンパリングの検出を可能にすることに注力し,損傷の可能性のある小包の3次元形状復元問題に取り組む。
入力として、単一のrgbイメージを使用し、例えば配達中の郵便配達員や配達中のクライアントなど、単純なハンドヘルドデバイスのみを利用できるユースケースに対応します。
本稿では,google scanned objects (gso) データセットをベースとし,完全な3dアノテーションを備えた13,000以上のパーセル画像からなる,新しい合成データセットparcel3dを提案する。
データセットには、シミュレーションで生成されたcuboid型、parcels、および損傷したparcelsを含む。
3dバウンディングボックスの推定と反復メッシュリファインメントを組み合わせた,cuberefine r-cnnと呼ばれる新しいアーキテクチャを提案することで,小包のミスハンドリングの検出に取り組んでいる。
実世界のシナリオでParcel3Dと既存のcuboid-shaped parcelsのデータセットをベンチマークする。
以上の結果から,Parcel3Dのトレーニングは実世界への移動を可能にするが,現実のシナリオへの信頼性の高い展開を実現することは依然として困難である。
立方体refine r-cnn はメッシュ ap の点で競合性能を示し、3次元メッシュ比較とタンパリング検出による直接変形評価を可能にする唯一のモデルである。
データセットとコードはhttps://a-nau.github.io/parcel3dで入手できる。
関連論文リスト
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics [17.533143584534155]
PokeFlexは3Dテクスチャメッシュ、ポイントクラウド、RGBイメージ、深度マップを含む、実世界のペアと注釈付きマルチモーダルデータを特徴とするデータセットである。
このようなデータは、オンライン3Dメッシュ再構築など、いくつかのダウンストリームタスクに活用することができる。
オンライン3Dメッシュ再構築におけるPokeFlexデータセットのユースケースを実演する。
論文 参考訳(メタデータ) (2024-10-10T07:54:17Z) - CN-RMA: Combined Network with Ray Marching Aggregation for 3D Indoors Object Detection from Multi-view Images [11.152821406076486]
CN-RMAは多視点画像から3次元屋内物体を検出する新しい手法である。
多視点画像からの3次元物体検出における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T03:59:47Z) - CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。
提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。
不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文 参考訳(メタデータ) (2022-10-09T13:38:48Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - Probabilistic Vehicle Reconstruction Using a Multi-Task CNN [0.0]
ステレオ画像からの形状認識型3D車両再構成のための確率論的アプローチを提案する。
具体的には、車両の向きと車両のキーポイントとワイヤフレームエッジの両方の確率分布を出力するCNNを訓練する。
本手法が最先端の結果を達成し、挑戦的なKITTIベンチマークで評価することを示した。
論文 参考訳(メタデータ) (2021-02-21T20:45:44Z) - H3D: Benchmark on Semantic Segmentation of High-Resolution 3D Point
Clouds and textured Meshes from UAV LiDAR and Multi-View-Stereo [4.263987603222371]
本稿では,3つの方法でユニークな3次元データセットを提案する。
ヘシグハイム(ドイツ語: Hessigheim, H3D)は、ドイツの都市。
片手で3次元データ分析の分野での研究を促進するとともに、新しいアプローチの評価とランク付けを目的としている。
論文 参考訳(メタデータ) (2021-02-10T09:33:48Z) - From Points to Multi-Object 3D Reconstruction [71.17445805257196]
単一のRGB画像から複数の3Dオブジェクトを検出し再構成する方法を提案する。
キーポイント検出器は、オブジェクトを中心点としてローカライズし、9-DoF境界ボックスや3D形状を含む全てのオブジェクト特性を直接予測する。
提示されたアプローチは、軽量な再構築を単一ステージで実行し、リアルタイム能力を持ち、完全に微分可能で、エンドツーエンドのトレーナーブルである。
論文 参考訳(メタデータ) (2020-12-21T18:52:21Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Factor Graph based 3D Multi-Object Tracking in Point Clouds [8.411514688735183]
明示的および固定的な代入に依存しない新しい最適化に基づくアプローチを提案する。
我々は、実世界のKITTI追跡データセットの性能を実証し、多くの最先端アルゴリズムよりも優れた結果を得る。
論文 参考訳(メタデータ) (2020-08-12T13:34:46Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。