論文の概要: DPODv2: Dense Correspondence-Based 6 DoF Pose Estimation
- arxiv url: http://arxiv.org/abs/2207.02805v1
- Date: Wed, 6 Jul 2022 16:48:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-07 15:00:26.967203
- Title: DPODv2: Dense Correspondence-Based 6 DoF Pose Estimation
- Title(参考訳): dpodv2: 高密度対応に基づく6自由度ポーズ推定
- Authors: Ivan Shugurov, Sergey Zakharov, Slobodan Ilic
- Abstract要約: DPODv2(Dense Pose Object Detector)と呼ばれる3ステージ6DoFオブジェクト検出手法を提案する。
本研究では,2次元物体検出器と高密度対応推定ネットワークを組み合わせることで,フル6DFのポーズを推定する多視点ポーズ補正手法を提案する。
DPODv2は、使用済みのデータモダリティとトレーニングデータの種類によらず、高速でスケーラブルなまま、すべてのデータに対して優れた結果を得る。
- 参考スコア(独自算出の注目度): 24.770767430749288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a three-stage 6 DoF object detection method called DPODv2 (Dense
Pose Object Detector) that relies on dense correspondences. We combine a 2D
object detector with a dense correspondence estimation network and a multi-view
pose refinement method to estimate a full 6 DoF pose. Unlike other deep
learning methods that are typically restricted to monocular RGB images, we
propose a unified deep learning network allowing different imaging modalities
to be used (RGB or Depth). Moreover, we propose a novel pose refinement method,
that is based on differentiable rendering. The main concept is to compare
predicted and rendered correspondences in multiple views to obtain a pose which
is consistent with predicted correspondences in all views. Our proposed method
is evaluated rigorously on different data modalities and types of training data
in a controlled setup. The main conclusions is that RGB excels in
correspondence estimation, while depth contributes to the pose accuracy if good
3D-3D correspondences are available. Naturally, their combination achieves the
overall best performance. We perform an extensive evaluation and an ablation
study to analyze and validate the results on several challenging datasets.
DPODv2 achieves excellent results on all of them while still remaining fast and
scalable independent of the used data modality and the type of training data
- Abstract(参考訳): 本研究では,dpodv2 (dense pose object detector) と呼ばれる3段階6自由度物体検出法を提案する。
本研究では,2次元物体検出器と高密度対応推定ネットワークと多視点姿勢補正法を組み合わせて,全6自由度姿勢を推定する。
単眼のrgb画像に制限される他のディープラーニング手法とは異なり、異なる画像モード(rgbまたは深さ)を使用できる統合型ディープラーニングネットワークを提案する。
また,識別可能なレンダリングに基づく新しいポーズ改善手法を提案する。
主な概念は、予測された対応とレンダリングされた対応を複数のビューで比較して、すべてのビューで予測された対応と一致するポーズを得ることである。
提案手法は,異なるデータモダリティとトレーニングデータの種類について,制御された設定で厳格に評価する。
主な結論は、rgbは対応推定に優れ、深さは良い3d-3d対応が可能であれば姿勢精度に寄与する。
当然、それらの組み合わせは全体的な最高のパフォーマンスを達成する。
本研究は,いくつかの挑戦的データセットを用いて,実験結果の分析と検証を行う。
DPODv2は、使用済みデータモダリティとトレーニングデータの種類によらず、高速でスケーラブルなまま、すべてのデータに対して優れた結果を得る
関連論文リスト
- IPoD: Implicit Field Learning with Point Diffusion for Generalizable 3D Object Reconstruction from Single RGB-D Images [50.4538089115248]
シングルビューRGB-D画像からの3Dオブジェクトの汎用化は依然として難しい課題である。
本稿では,暗黙の場学習と点拡散を調和させる新しい手法IPoDを提案する。
CO3D-v2データセットによる実験では、IPoDの優位性が確認され、Fスコアは7.8%、チャンファー距離は28.6%向上した。
論文 参考訳(メタデータ) (2024-03-30T07:17:37Z) - DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - CheckerPose: Progressive Dense Keypoint Localization for Object Pose
Estimation with Graph Neural Network [66.24726878647543]
単一のRGB画像から固い物体の6-DoFのポーズを推定することは、非常に難しい課題である。
近年の研究では、高密度対応型解の大きな可能性を示している。
そこで本研究では,CheckerPoseというポーズ推定アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-29T17:30:53Z) - Towards Two-view 6D Object Pose Estimation: A Comparative Study on
Fusion Strategy [16.65699606802237]
現在のRGBベースの6Dオブジェクトポーズ推定手法は、データセットや実世界のアプリケーションで顕著なパフォーマンスを達成した。
本稿では2枚のRGB画像から暗黙的な3D情報を学習する6次元オブジェクトポーズ推定フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-01T08:22:34Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - ZebraPose: Coarse to Fine Surface Encoding for 6DoF Object Pose
Estimation [76.31125154523056]
物体表面を高密度に表現できる離散ディスクリプタを提案する。
また,微粒化対応予測が可能な微粒化学習戦略を提案する。
論文 参考訳(メタデータ) (2022-03-17T16:16:24Z) - Pose Estimation of Specific Rigid Objects [0.7931904787652707]
本稿では,RGBまたはRGB-D入力画像から剛体物体の6次元ポーズを推定する問題に対処する。
この問題は、ロボット操作、拡張現実、自律運転など、多くの応用分野において非常に重要である。
論文 参考訳(メタデータ) (2021-12-30T14:36:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。