論文の概要: Improving 2D-3D Dense Correspondences with Diffusion Models for 6D
Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2402.06436v1
- Date: Fri, 9 Feb 2024 14:27:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 16:40:34.911053
- Title: Improving 2D-3D Dense Correspondences with Diffusion Models for 6D
Object Pose Estimation
- Title(参考訳): 6次元物体姿勢推定のための拡散モデルによる2次元3次元密度対応の改善
- Authors: Peter H\"onig, Stefan Thalhammer, Markus Vincze
- Abstract要約: RGB画像と3D空間の2D-3D対応性の推定は、6Dオブジェクトのポーズ推定における根本的な問題である。
近年のポーズ推定では、高密度対応マップとポイント・ツー・ポイントアルゴリズムを用いてオブジェクトのポーズを推定している。
画像から画像への変換の最近の進歩は、ベンチマークデータセットで評価した場合、拡散モデルの方が優れた選択となっている。
- 参考スコア(独自算出の注目度): 9.760487761422326
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating 2D-3D correspondences between RGB images and 3D space is a
fundamental problem in 6D object pose estimation. Recent pose estimators use
dense correspondence maps and Point-to-Point algorithms to estimate object
poses. The accuracy of pose estimation depends heavily on the quality of the
dense correspondence maps and their ability to withstand occlusion, clutter,
and challenging material properties. Currently, dense correspondence maps are
estimated using image-to-image translation models based on GANs, Autoencoders,
or direct regression models. However, recent advancements in image-to-image
translation have led to diffusion models being the superior choice when
evaluated on benchmarking datasets. In this study, we compare image-to-image
translation networks based on GANs and diffusion models for the downstream task
of 6D object pose estimation. Our results demonstrate that the diffusion-based
image-to-image translation model outperforms the GAN, revealing potential for
further improvements in 6D object pose estimation models.
- Abstract(参考訳): RGB画像と3D空間の2D-3D対応性の推定は、6Dオブジェクトのポーズ推定における根本的な問題である。
近年のポーズ推定では、高密度対応マップとポイント・ツー・ポイントアルゴリズムを用いてオブジェクトのポーズを推定している。
ポーズ推定の精度は、密接な対応マップの品質と、密閉性、乱れ、難解な材料特性に耐えられる能力に大きく依存する。
現在では、GAN、オートエンコーダ、あるいは直接回帰モデルに基づく画像から画像への変換モデルを用いて、密度の高い対応写像を推定している。
しかし、画像から画像への翻訳の最近の進歩は、ベンチマークデータセットでの評価において拡散モデルが優れた選択となっている。
本研究では、6次元オブジェクトポーズ推定の下流課題に対するGANと拡散モデルに基づく画像間翻訳ネットワークを比較した。
その結果,拡散に基づく画像-画像間の変換モデルの方がGANより優れており,さらに6次元オブジェクトのポーズ推定モデルの改善の可能性を明らかにした。
関連論文リスト
- FocalPose++: Focal Length and Object Pose Estimation via Render and Compare [35.388094104164175]
本稿では,カメラオブジェクトの6Dポーズとカメラ焦点長を同時推定するニューラルレンダリング・アンド・コンペア手法であるFocalPose++を紹介する。
制御不能な環境で、既知の3Dモデルを記述する3つの挑戦的なベンチマークデータセットの結果を示す。
論文 参考訳(メタデータ) (2023-11-15T13:28:02Z) - Shape-Constraint Recurrent Flow for 6D Object Pose Estimation [15.238626453460666]
6次元オブジェクトポーズ推定のための形状制約リカレントマッチングフレームワークを提案する。
まず、初期ポーズと現在推定されているポーズの間の2次元再投影の変位に基づいて、ポーズ誘起フローを計算する。
次に、このポーズ誘導フローを用いて、以下の反復に対する相関写像を構築する。
論文 参考訳(メタデータ) (2023-06-23T02:36:34Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - Focal Length and Object Pose Estimation via Render and Compare [36.177948726394874]
本稿では,カメラオブジェクトの6Dポーズとカメラ焦点長を同時推定するニューラルレンダリング・アンド・コンペア手法であるFocalPoseを紹介する。
制御不能な環境で、既知の3Dモデルを記述する3つの挑戦的なベンチマークデータセットの結果を示す。
論文 参考訳(メタデータ) (2022-04-11T14:26:53Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z) - ZebraPose: Coarse to Fine Surface Encoding for 6DoF Object Pose
Estimation [76.31125154523056]
物体表面を高密度に表現できる離散ディスクリプタを提案する。
また,微粒化対応予測が可能な微粒化学習戦略を提案する。
論文 参考訳(メタデータ) (2022-03-17T16:16:24Z) - Category-Level 6D Object Pose Estimation via Cascaded Relation and
Recurrent Reconstruction Networks [22.627704070200863]
カテゴリーレベルの6Dポーズ推定は、ロボット操作や拡張現実といった多くのシナリオに不可欠である。
カテゴリレベルの6次元ポーズ推定をカスケード関係と再帰的再構成ネットワークを用いて高精度に行う。
我々の手法は最新の最先端のSPDを4.9%、CAMERA25データセットで17.7%で上回る。
論文 参考訳(メタデータ) (2021-08-19T15:46:52Z) - SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation [98.83762558394345]
SO-Poseは、オブジェクトの6自由度(6DoF)をすべて、単一のRGBイメージから散らばった環境でポーズさせるフレームワークである。
本稿では,3次元オブジェクトの2層表現を確立するために,自己閉塞に関する新たな推論を導入する。
対応性,自己閉塞性,6次元ポーズを整列する層間合成により,精度とロバスト性をさらに向上させることができる。
論文 参考訳(メタデータ) (2021-08-18T19:49:29Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。