論文の概要: Category-Level 6D Object Pose Estimation via Cascaded Relation and
Recurrent Reconstruction Networks
- arxiv url: http://arxiv.org/abs/2108.08755v1
- Date: Thu, 19 Aug 2021 15:46:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-20 14:29:58.552854
- Title: Category-Level 6D Object Pose Estimation via Cascaded Relation and
Recurrent Reconstruction Networks
- Title(参考訳): カスケード関係とリカレントリコンストラクションネットワークによるカテゴリーレベル6次元オブジェクト位置推定
- Authors: Jiaze Wang, Kai Chen, Qi Dou
- Abstract要約: カテゴリーレベルの6Dポーズ推定は、ロボット操作や拡張現実といった多くのシナリオに不可欠である。
カテゴリレベルの6次元ポーズ推定をカスケード関係と再帰的再構成ネットワークを用いて高精度に行う。
我々の手法は最新の最先端のSPDを4.9%、CAMERA25データセットで17.7%で上回る。
- 参考スコア(独自算出の注目度): 22.627704070200863
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Category-level 6D pose estimation, aiming to predict the location and
orientation of unseen object instances, is fundamental to many scenarios such
as robotic manipulation and augmented reality, yet still remains unsolved.
Precisely recovering instance 3D model in the canonical space and accurately
matching it with the observation is an essential point when estimating 6D pose
for unseen objects. In this paper, we achieve accurate category-level 6D pose
estimation via cascaded relation and recurrent reconstruction networks.
Specifically, a novel cascaded relation network is dedicated for advanced
representation learning to explore the complex and informative relations among
instance RGB image, instance point cloud and category shape prior. Furthermore,
we design a recurrent reconstruction network for iterative residual refinement
to progressively improve the reconstruction and correspondence estimations from
coarse to fine. Finally, the instance 6D pose is obtained leveraging the
estimated dense correspondences between the instance point cloud and the
reconstructed 3D model in the canonical space. We have conducted extensive
experiments on two well-acknowledged benchmarks of category-level 6D pose
estimation, with significant performance improvement over existing approaches.
On the representatively strict evaluation metrics of $3D_{75}$ and $5^{\circ}2
cm$, our method exceeds the latest state-of-the-art SPD by $4.9\%$ and $17.7\%$
on the CAMERA25 dataset, and by $2.7\%$ and $8.5\%$ on the REAL275 dataset.
Codes are available at https://wangjiaze.cn/projects/6DPoseEstimation.html.
- Abstract(参考訳): カテゴリーレベルの6Dポーズ推定は、見えないオブジェクトインスタンスの位置と向きを予測することを目的としており、ロボット操作や拡張現実といった多くのシナリオに基礎を置いているが、未解決のままである。
標準空間における正確に復元されたインスタンス3Dモデルを観察と正確にマッチングすることは、見えない物体に対して6Dのポーズを推定する際に必須のポイントである。
本稿では,カテゴリレベルの6次元ポーズ推定をカスケード関係と繰り返し再構成ネットワークを用いて高精度に行う。
具体的には、従来のRGB画像、インスタンスポイントクラウド、カテゴリ形状の複雑な情報的関係を探索するために、高度な表現学習のための新しいカスケード関係ネットワークを提供する。
さらに, 繰り返し残差補正のための再帰的再構成ネットワークの設計を行い, 粗粒から微粒までの復元および対応推定を段階的に改善する。
最後に、インスタンス6Dポーズを、標準空間におけるインスタンス点雲と再構成された3Dモデルとの推定密度対応を利用して得られる。
我々は,カテゴリーレベルの6次元ポーズ推定の2つのよく知られたベンチマークを広範囲に実験し,既存の手法よりも大幅な性能改善を行った。
典型的な3D_{75}$と5^{\circ}2 cm$の厳密な評価基準では、我々の手法は最新の最先端のSPDを4.9\%、CAMERA25データセットで17.7\%、REAL275データセットで2.7\%、そして8.5\%に上回る。
コードはhttps://wangjiaze.cn/projects/6dposeestimation.htmlで入手できる。
関連論文リスト
- Improving 2D-3D Dense Correspondences with Diffusion Models for 6D
Object Pose Estimation [9.760487761422326]
RGB画像と3D空間の2D-3D対応性の推定は、6Dオブジェクトのポーズ推定における根本的な問題である。
近年のポーズ推定では、高密度対応マップとポイント・ツー・ポイントアルゴリズムを用いてオブジェクトのポーズを推定している。
画像から画像への変換の最近の進歩は、ベンチマークデータセットで評価した場合、拡散モデルの方が優れた選択となっている。
論文 参考訳(メタデータ) (2024-02-09T14:27:40Z) - RelPose++: Recovering 6D Poses from Sparse-view Observations [66.6922660401558]
スパースビュー画像集合(2-8画像)から6次元カメラポーズを推定する作業に対処する。
我々は,画像対上の相対回転よりも分布を推定するネットワークを学習するRelPoseフレームワークを構築した。
最終システムは,先行技術よりも6次元ポーズ予測を大幅に改善する。
論文 参考訳(メタデータ) (2023-05-08T17:59:58Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。
本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文 参考訳(メタデータ) (2022-03-28T10:31:29Z) - NeRF-Pose: A First-Reconstruct-Then-Regress Approach for
Weakly-supervised 6D Object Pose Estimation [44.42449011619408]
トレーニング中に2次元オブジェクトセグメンテーションと既知の相対カメラポーズしか必要としないNeRF-Poseという,弱教師付き再構築型パイプラインを提案する。
予測応答から安定かつ正確なポーズを推定するために、NeRF対応RAN+SACアルゴリズムを用いる。
LineMod-Occlusion 実験の結果,提案手法は6次元ポーズ推定法と比較して最先端の精度を持つことがわかった。
論文 参考訳(メタデータ) (2022-03-09T15:28:02Z) - Leveraging SE(3) Equivariance for Self-Supervised Category-Level Object
Pose Estimation [30.04752448942084]
カテゴリーレベルのオブジェクトポーズ推定は、オブジェクトCADモデルにアクセスすることなく、既知のカテゴリから未確認のオブジェクトインスタンスの6Dオブジェクトポーズを見つけることを目的としている。
本研究では,1つの3次元点群からカテゴリレベルの6次元オブジェクトのポーズを推定する自己教師型学習フレームワークを初めて提案する。
論文 参考訳(メタデータ) (2021-10-30T06:46:44Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - Next-best-view Regression using a 3D Convolutional Neural Network [0.9449650062296823]
本論文では,次のベストビュー問題に対するデータ駆動アプローチを提案する。
提案手法は、次のベストビューのbtxtpositionを抑えるために、以前の再構成で3D畳み込みニューラルネットワークを訓練する。
提案手法を2つの実験グループを用いて検証した。
論文 参考訳(メタデータ) (2021-01-23T01:50:26Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。