論文の概要: RefPose: Leveraging Reference Geometric Correspondences for Accurate 6D Pose Estimation of Unseen Objects
- arxiv url: http://arxiv.org/abs/2505.10841v1
- Date: Fri, 16 May 2025 04:17:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:14.061384
- Title: RefPose: Leveraging Reference Geometric Correspondences for Accurate 6D Pose Estimation of Unseen Objects
- Title(参考訳): RefPose: 未確認物体の正確な6次元空間推定のための参照幾何対応の活用
- Authors: Jaeguk Kim, Jaewoo Park, Keuntek Lee, Nam Ik Cho,
- Abstract要約: RefPoseは、参照画像と幾何対応をガイダンスとして活用するオブジェクトポーズ推定の革新的なアプローチである。
RefPoseは、競争力のあるランタイムを維持しながら、最先端の結果を達成することを示す。
- 参考スコア(独自算出の注目度): 21.047434860977454
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating the 6D pose of unseen objects from monocular RGB images remains a challenging problem, especially due to the lack of prior object-specific knowledge. To tackle this issue, we propose RefPose, an innovative approach to object pose estimation that leverages a reference image and geometric correspondence as guidance. RefPose first predicts an initial pose by using object templates to render the reference image and establish the geometric correspondence needed for the refinement stage. During the refinement stage, RefPose estimates the geometric correspondence of the query based on the generated references and iteratively refines the pose through a render-and-compare approach. To enhance this estimation, we introduce a correlation volume-guided attention mechanism that effectively captures correlations between the query and reference images. Unlike traditional methods that depend on pre-defined object models, RefPose dynamically adapts to new object shapes by leveraging a reference image and geometric correspondence. This results in robust performance across previously unseen objects. Extensive evaluation on the BOP benchmark datasets shows that RefPose achieves state-of-the-art results while maintaining a competitive runtime.
- Abstract(参考訳): モノクロRGB画像から見えない物体の6Dポーズを推定することは、特に以前のオブジェクト固有の知識が欠如しているため、難しい問題である。
この問題に対処するために,参照画像と幾何対応をガイダンスとして活用するオブジェクトポーズ推定の革新的なアプローチであるRefPoseを提案する。
RefPoseはまず、オブジェクトテンプレートを使用して参照画像をレンダリングし、改善段階に必要な幾何対応を確立することで、初期ポーズを予測する。
改良段階では、RefPoseは生成された参照に基づいてクエリの幾何学的対応を推定し、レンダリング・アンド・コンペアアプローチによってポーズを反復的に洗練する。
この推定を強化するために,クエリと参照画像の相関を効果的にキャプチャする相関ボリューム誘導型アテンション機構を導入する。
事前定義されたオブジェクトモデルに依存する従来の手法とは異なり、RefPoseは参照画像と幾何学的対応を利用して、動的に新しいオブジェクト形状に適応する。
これにより、以前は見えなかったオブジェクト間で堅牢なパフォーマンスが得られる。
BOPベンチマークデータセットの大規模な評価は、RefPoseが競合ランタイムを維持しながら最先端の結果を達成することを示している。
関連論文リスト
- UNOPose: Unseen Object Pose Estimation with an Unposed RGB-D Reference Image [86.7128543480229]
見えないオブジェクトのポーズ推定方法はCADモデルや複数の参照ビューに依存することが多い。
参照取得を簡略化するために,未提示のRGB-D参照画像を用いて未確認オブジェクトのポーズを推定することを目的とする。
単参照型オブジェクトポーズ推定のための新しいアプローチとベンチマークをUNOPoseと呼ぶ。
論文 参考訳(メタデータ) (2024-11-25T05:36:00Z) - 3D-Aware Hypothesis & Verification for Generalizable Relative Object
Pose Estimation [69.73691477825079]
一般化可能なオブジェクトポーズ推定の問題に対処する新しい仮説検証フレームワークを提案する。
信頼性を計測するために,2つの入力画像から学習した3次元オブジェクト表現に3次元変換を明示的に適用する3D認識検証を導入する。
論文 参考訳(メタデータ) (2023-10-05T13:34:07Z) - LocPoseNet: Robust Location Prior for Unseen Object Pose Estimation [69.70498875887611]
LocPoseNetは、見えないオブジェクトに先立って、ロバストにロケーションを学習することができる。
提案手法は,LINEMOD と GenMOP において,既存の作業よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-29T15:21:34Z) - What's in your hands? 3D Reconstruction of Generic Objects in Hands [49.12461675219253]
我々の研究は、単一のRGB画像からハンドヘルドオブジェクトを再構築することを目的としている。
通常、既知の3Dテンプレートを仮定し、問題を3Dポーズ推定に還元する以前の作業とは対照的に、我々の作業は3Dテンプレートを知らずに汎用的なハンドヘルドオブジェクトを再構成する。
論文 参考訳(メタデータ) (2022-04-14T17:59:02Z) - GPV-Pose: Category-level Object Pose Estimation via Geometry-guided
Point-wise Voting [103.74918834553249]
GPV-Poseはロバストなカテゴリーレベルのポーズ推定のための新しいフレームワークである。
幾何学的洞察を利用して、カテゴリーレベルのポーズ感応的特徴の学習を強化する。
一般的な公開ベンチマークにおいて、最先端の競合相手に優れた結果をもたらす。
論文 参考訳(メタデータ) (2022-03-15T13:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。