論文の概要: Towards Deep Learning-based 6D Bin Pose Estimation in 3D Scans
- arxiv url: http://arxiv.org/abs/2112.09598v1
- Date: Fri, 17 Dec 2021 16:19:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-20 16:01:34.302523
- Title: Towards Deep Learning-based 6D Bin Pose Estimation in 3D Scans
- Title(参考訳): 3次元スキャンによるディープラーニングに基づく6次元ビンポーズ推定
- Authors: Luk\'a\v{s} Gajdo\v{s}ech, Viktor Kocur, Martin Stuchl\'ik,
Luk\'a\v{s} Hudec, Martin Madaras
- Abstract要約: 本稿では,3次元スキャンにおけるビンの6次元ポーズ推定の特定のタスクに焦点を当てた。
合成データと実スキャンからなる高品質なデータセットを,正確なアノテーションを付加した構造化光スキャナーにより取得する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: An automated robotic system needs to be as robust as possible and fail-safe
in general while having relatively high precision and repeatability. Although
deep learning-based methods are becoming research standard on how to approach
3D scan and image processing tasks, the industry standard for processing this
data is still analytically-based. Our paper claims that analytical methods are
less robust and harder for testing, updating, and maintaining. This paper
focuses on a specific task of 6D pose estimation of a bin in 3D scans.
Therefore, we present a high-quality dataset composed of synthetic data and
real scans captured by a structured-light scanner with precise annotations.
Additionally, we propose two different methods for 6D bin pose estimation, an
analytical method as the industrial standard and a baseline data-driven method.
Both approaches are cross-evaluated, and our experiments show that augmenting
the training on real scans with synthetic data improves our proposed
data-driven neural model. This position paper is preliminary, as proposed
methods are trained and evaluated on a relatively small initial dataset which
we plan to extend in the future.
- Abstract(参考訳): 自動化されたロボットシステムは可能な限り堅牢で、一般的にはフェールセーフでなければならない。
深層学習に基づく手法は、3Dスキャンと画像処理タスクへのアプローチの標準となっているが、このデータ処理の業界標準はまだ分析ベースである。
本稿では, 分析手法はより堅牢で, テスト, 更新, メンテナンスが困難であると主張している。
本稿では3次元スキャンにおけるビンの6次元ポーズ推定の特定のタスクに焦点を当てる。
そこで本研究では, 高精度なアノテーションを用いた構造化光スキャナーにより, 合成データと実スキャンからなる高品質なデータセットを提案する。
さらに,6次元ビンポーズ推定法,産業標準としての分析法,ベースラインデータ駆動方式の2つの異なる手法を提案する。
両者のアプローチは相互評価され,実スキャンのトレーニングを合成データで強化することで,提案するデータ駆動ニューラルモデルが改善されることを示す。
提案手法は,今後拡張する計画である比較的小さな初期データセットに基づいて訓練され,評価されるので,予備的である。
関連論文リスト
- SCoDA: Domain Adaptive Shape Completion for Real Scans [78.92028595499245]
点雲からの3D形状の完成は、特に現実世界のオブジェクトのスキャンによる難しい作業である。
合成データから実スキャン形状完了の領域適応のための新しいタスクであるSCoDAを提案する。
本稿では,知識伝達のための新しいクロスドメイン機能融合手法と,実データからの堅牢な学習のための新しいボリューム一貫性の自己学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-20T09:38:26Z) - What Stops Learning-based 3D Registration from Working in the Real
World? [53.68326201131434]
この研究は、3Dポイントのクラウド登録失敗の原因を特定し、その原因を分析し、解決策を提案する。
最終的に、これは最も実践的な3D登録ネットワーク(BPNet)に変換される。
我々のモデルは微調整をせずに実データに一般化し、商用センサで得られた見えない物体の点雲上で最大67%の精度に達する。
論文 参考訳(メタデータ) (2021-11-19T19:24:27Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - 3D Registration for Self-Occluded Objects in Context [66.41922513553367]
このシナリオを効果的に処理できる最初のディープラーニングフレームワークを紹介します。
提案手法はインスタンスセグメンテーションモジュールとポーズ推定モジュールから構成される。
これにより、高価な反復手順を必要とせず、ワンショットで3D登録を行うことができます。
論文 参考訳(メタデータ) (2020-11-23T08:05:28Z) - Bridging the Reality Gap for Pose Estimation Networks using Sensor-Based
Domain Randomization [1.4290119665435117]
合成データに基づいて訓練された手法は、2Dの領域ランダム化をより発展させるため、2D画像を使用する。
提案手法では,3次元データをネットワークに統合し,ポーズ推定の精度を高める。
3つの大規模ポーズ推定ベンチマーク実験により, 提案手法は, 合成データを用いた従来手法よりも優れていたことがわかった。
論文 参考訳(メタデータ) (2020-11-17T09:12:11Z) - se(3)-TrackNet: Data-driven 6D Pose Tracking by Calibrating Image
Residuals in Synthetic Domains [12.71983073907091]
本研究では,長期6次元ポーズトラッキングのためのデータ駆動型最適化手法を提案する。
本研究の目的は、現在のRGB-D観測と、前回の推定値と対象物のモデルに基づいて条件付けされた合成画像から、最適な相対的なポーズを特定することである。
提案手法は, 実画像を用いて訓練した場合でも, 常に頑健な評価を達成し, 代替品よりも優れる。
論文 参考訳(メタデータ) (2020-07-27T21:09:36Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。