論文の概要: DONet: Learning Category-Level 6D Object Pose and Size Estimation from
Depth Observation
- arxiv url: http://arxiv.org/abs/2106.14193v1
- Date: Sun, 27 Jun 2021 10:41:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 17:52:23.520135
- Title: DONet: Learning Category-Level 6D Object Pose and Size Estimation from
Depth Observation
- Title(参考訳): DONet:カテゴリーレベル6次元オブジェクトマップの学習と深さ観測によるサイズ推定
- Authors: Haitao Lin, Zichang Liu, Chilam Cheang, Lingwei Zhang, Yanwei Fu,
Xiangyang Xue
- Abstract要約: 単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。
筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。
我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
- 参考スコア(独自算出の注目度): 53.55300278592281
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a method of Category-level 6D Object Pose and Size Estimation
(COPSE) from a single depth image, without external pose-annotated real-world
training data. While previous works exploit visual cues in RGB(D) images, our
method makes inferences based on the rich geometric information of the object
in the depth channel alone. Essentially, our framework explores such geometric
information by learning the unified 3D Orientation-Consistent Representations
(3D-OCR) module, and further enforced by the property of Geometry-constrained
Reflection Symmetry (GeoReS) module. The magnitude information of object size
and the center point is finally estimated by Mirror-Paired Dimensional
Estimation (MPDE) module. Extensive experiments on the category-level NOCS
benchmark demonstrate that our framework competes with state-of-the-art
approaches that require labeled real-world images. We also deploy our approach
to a physical Baxter robot to perform manipulation tasks on unseen but
category-known instances, and the results further validate the efficacy of our
proposed model. Our videos are available in the supplementary material.
- Abstract(参考訳): 本研究では,外部のポーズアノテートした実世界のトレーニングデータを用いずに,単一深度画像からカテゴリレベルの6Dオブジェクトポスとサイズ推定(COPSE)を提案する。
従来の研究はRGB(D)画像の視覚的手がかりを利用していたが,本手法は深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。
本フレームワークは,3次元指向性表現(3D-OCR)モジュールを統一的に学習し,幾何制約反射対称性(GeoReS)モジュールの特性によってさらに強化される。
オブジェクトサイズと中心点の大きさ情報は、ミラーペア次元推定(MPDE)モジュールによって最終的に推定される。
カテゴリレベルのNOCSベンチマークにおいて、我々のフレームワークは、ラベル付き実世界の画像を必要とする最先端のアプローチと競合することを示した。
また,このアプローチを物理的baxterロボットに展開して,未知だがカテゴリの既知のインスタンスで操作タスクを実行し,提案モデルの有効性をさらに検証した。
私たちのビデオは補足資料で閲覧できます。
関連論文リスト
- MV-ROPE: Multi-view Constraints for Robust Category-level Object Pose and Size Estimation [23.615122326731115]
本稿では,RGBビデオストリームを利用した新しいソリューションを提案する。
本フレームワークは,スケール対応単分子高密度SLAMソリューション,軽量オブジェクトポーズ予測器,オブジェクトレベルのポーズグラフの3つのモジュールから構成される。
提案手法は,高精細度情報を用いた公開データセットを用いた場合,最先端のRGB-D手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2023-08-17T08:29:54Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - Category-Agnostic 6D Pose Estimation with Conditional Neural Processes [19.387280883044482]
未知物体の6次元ポーズ推定のためのメタラーニング手法を提案する。
本アルゴリズムは,オブジェクトの表現をカテゴリに依存しない方法で学習し,オブジェクトカテゴリをまたいだ強力な一般化機能を実現する。
論文 参考訳(メタデータ) (2022-06-14T20:46:09Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Aug3D-RPN: Improving Monocular 3D Object Detection by Synthetic Images
with Virtual Depth [64.29043589521308]
仮想深度で画像を合成することでトレーニングデータを増強するレンダリングモジュールを提案する。
レンダリングモジュールは、RGB画像と対応するスパース深度画像とを入力として、さまざまなフォトリアリスティック合成画像を出力する。
さらに,深度推定タスクを通じて共同で最適化することで,検出モデルを改善する補助モジュールを導入する。
論文 参考訳(メタデータ) (2021-07-28T11:00:47Z) - Learning Monocular Depth in Dynamic Scenes via Instance-Aware Projection
Consistency [114.02182755620784]
本稿では,複数の動的物体の6-DoF動作,エゴモーション,深度を,監督なしで一眼レフカメラで明示的にモデル化する,エンドツーエンドのジョイントトレーニングフレームワークを提案する。
筆者らのフレームワークは,最先端の深度・動き推定法より優れていた。
論文 参考訳(メタデータ) (2021-02-04T14:26:42Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。