論文の概要: GIVEPose: Gradual Intra-class Variation Elimination for RGB-based Category-Level Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2503.15110v2
- Date: Thu, 20 Mar 2025 10:15:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-21 12:14:52.062553
- Title: GIVEPose: Gradual Intra-class Variation Elimination for RGB-based Category-Level Object Pose Estimation
- Title(参考訳): GIVEPose: RGBに基づくカテゴリーレベルオブジェクトのパラメータ推定のためのクラス内変動の経時的除去
- Authors: Zinqin Huang, Gu Wang, Chenyangguang Zhang, Ruida Zhang, Xiu Li, Xiangyang Ji,
- Abstract要約: GIVEPoseは,カテゴリレベルのオブジェクトのポーズ推定のための階層内変分除去を実装したフレームワークである。
GIVEPoseは、既存の最先端のRGBベースのアプローチを大きく上回っている。
- 参考スコア(独自算出の注目度): 61.46277064819665
- License:
- Abstract: Recent advances in RGBD-based category-level object pose estimation have been limited by their reliance on precise depth information, restricting their broader applicability. In response, RGB-based methods have been developed. Among these methods, geometry-guided pose regression that originated from instance-level tasks has demonstrated strong performance. However, we argue that the NOCS map is an inadequate intermediate representation for geometry-guided pose regression method, as its many-to-one correspondence with category-level pose introduces redundant instance-specific information, resulting in suboptimal results. This paper identifies the intra-class variation problem inherent in pose regression based solely on the NOCS map and proposes the Intra-class Variation-Free Consensus (IVFC) map, a novel coordinate representation generated from the category-level consensus model. By leveraging the complementary strengths of the NOCS map and the IVFC map, we introduce GIVEPose, a framework that implements Gradual Intra-class Variation Elimination for category-level object pose estimation. Extensive evaluations on both synthetic and real-world datasets demonstrate that GIVEPose significantly outperforms existing state-of-the-art RGB-based approaches, achieving substantial improvements in category-level object pose estimation. Our code is available at https://github.com/ziqin-h/GIVEPose.
- Abstract(参考訳): RGBDに基づくカテゴリレベルのオブジェクトポーズ推定の最近の進歩は、正確な深度情報に依存して、より広範な適用性を制限することで制限されている。
これに対してRGBベースの手法が開発されている。
これらの手法のうち、インスタンスレベルのタスクから派生した幾何誘導されたポーズ回帰は、強い性能を示す。
しかし、NOCSマップは、カテゴリレベルのポーズとの多対一対応が冗長なインスタンス固有情報を導入し、最適でない結果をもたらすため、幾何誘導ポーズ回帰法の不十分な中間表現であると主張する。
本稿では,NOCSマップのみに基づくポーズ回帰に固有のクラス内変動問題を特定し,カテゴリレベルのコンセンサスモデルから生成される新しい座標表現であるIVFCマップを提案する。
NOCSマップとIVFCマップの相補的な長所を活用することで、カテゴリレベルのオブジェクトのポーズ推定に段階的なクラス内変分除去を実装するフレームワークであるGIVEPoseを導入する。
GIVEPoseは、合成データセットと実世界のデータセットの両方において、既存のRGBベースのアプローチよりも大幅に優れており、カテゴリレベルのオブジェクトのポーズ推定において大幅に改善されている。
私たちのコードはhttps://github.com/ziqin-h/GIVEPose.orgから入手可能です。
関連論文リスト
- GCE-Pose: Global Context Enhancement for Category-level Object Pose Estimation [52.910282443646864]
モデルフリーなカテゴリレベルのポーズ推定における重要な課題は、特定のカテゴリ内の様々なインスタンスにまたがって一般化されるコンテキストオブジェクトの特徴の抽出である。
GCE-Poseは、カテゴリレベルのグローバルコンテキストを予め統合することにより、新規インスタンスのポーズ推定を強化する手法である。
論文 参考訳(メタデータ) (2025-02-06T18:35:13Z) - UNOPose: Unseen Object Pose Estimation with an Unposed RGB-D Reference Image [86.7128543480229]
見えないオブジェクトのポーズ推定方法はCADモデルや複数の参照ビューに依存することが多い。
参照取得を簡略化するために,未提示のRGB-D参照画像を用いて未確認オブジェクトのポーズを推定することを目的とする。
単参照型オブジェクトポーズ推定のための新しいアプローチとベンチマークをUNOPoseと呼ぶ。
論文 参考訳(メタデータ) (2024-11-25T05:36:00Z) - LaPose: Laplacian Mixture Shape Modeling for RGB-Based Category-Level Object Pose Estimation [43.549593231397644]
LaPoseは、オブジェクトの形状をPose推定のためのLaplacian混合モデルとしてモデル化する、新しいフレームワークである。
各点を確率分布として表現することにより、形状の不確実性を明確に定量化する。
LaPoseは、カテゴリレベルのオブジェクトポーズ推定における最先端のパフォーマンスを得る。
論文 参考訳(メタデータ) (2024-09-24T04:20:18Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - CATRE: Iterative Point Clouds Alignment for Category-level Object Pose
Refinement [52.41884119329864]
カテゴリーレベルのオブジェクトポーズとサイズ精細化器 CATRE は、点雲からのポーズ推定を反復的に強化し、正確な結果が得られる。
提案手法は,REAL275,CAMERA25,LMのベンチマークを85.32Hzまで高速化する。
論文 参考訳(メタデータ) (2022-07-17T05:55:00Z) - GPV-Pose: Category-level Object Pose Estimation via Geometry-guided
Point-wise Voting [103.74918834553249]
GPV-Poseはロバストなカテゴリーレベルのポーズ推定のための新しいフレームワークである。
幾何学的洞察を利用して、カテゴリーレベルのポーズ感応的特徴の学習を強化する。
一般的な公開ベンチマークにおいて、最先端の競合相手に優れた結果をもたらす。
論文 参考訳(メタデータ) (2022-03-15T13:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。