論文の概要: Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2504.15134v2
- Date: Sun, 27 Apr 2025 02:01:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.743577
- Title: Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation
- Title(参考訳): カテゴリーレベルオブジェクト位置推定のための局所的-局所的幾何学的アグリゲーションを用いたインスタンス適応型キーポイント学習
- Authors: Xiao Zhang, Lu Zou, Tao Lu, Yuan Yao, Zhangjin Huang, Guoping Wang,
- Abstract要約: INKL-Poseは、新しいカテゴリレベルのオブジェクトポーズ推定フレームワークである。
Instance-Adaptive Keypoint Learningをローカル-グロバルな幾何学的アグリゲーションで実現している。
CAMERA25、REAL275、HouseCat6Dの実験は、INKL-Poseが最先端の性能を達成することを示した。
- 参考スコア(独自算出の注目度): 19.117822086210513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Category-level object pose estimation aims to predict the 6D pose and size of previously unseen instances from predefined categories, requiring strong generalization across diverse object instances. Although many previous methods attempt to mitigate intra-class variations, they often struggle with instances exhibiting complex geometries or significant deviations from canonical shapes. To address this challenge, we propose INKL-Pose, a novel category-level object pose estimation framework that enables INstance-adaptive Keypoint Learning with local-to-global geometric aggregation. Specifically, our approach first predicts semantically consistent and geometric informative keypoints through an Instance-Adaptive Keypoint Generator, then refines them with: (1) a Local Keypoint Feature Aggregator capturing fine-grained geometries, and (2) a Global Keypoint Feature Aggregator using bidirectional Mamba for structural consistency. To enable bidirectional modeling in Mamba, we introduce a Feature Sequence Flipping strategy that preserves spatial coherence while constructing backward feature sequences. Additionally, we design a surface loss and a separation loss to enforce uniform coverage and spatial diversity in keypoint distribution. The generated keypoints are finally mapped to a canonical space for regressing the object's 6D pose and size. Extensive experiments on CAMERA25, REAL275, and HouseCat6D demonstrate that INKL-Pose achieves state-of-the-art performance and significantly outperforms existing methods.
- Abstract(参考訳): カテゴリレベルのオブジェクトポーズ推定は、事前に定義されたカテゴリから、未確認のインスタンスの6Dのポーズとサイズを予測することを目的としており、多様なオブジェクトインスタンスに対して強力な一般化が必要である。
従来の多くの手法はクラス内変異を緩和しようとするが、複雑なジオメトリーを示す例や、標準形状からの顕著な偏差を示す例にしばしば苦労する。
この課題に対処するために,Instance-Adaptive Keypoint Learning with local-to-global geometry aggregate を実現する,新しいカテゴリレベルのオブジェクトポーズ推定フレームワーク INKL-Pose を提案する。
具体的には,(1) 局所キーポイント特徴集合体が微細なジオメトリをキャプチャし,(2) 双方向マンバを用いたグローバルキーポイント特徴集合体が構造整合性を示す。
マンバにおける双方向モデリングを実現するために,後方特徴系列を構築しながら空間コヒーレンスを保ちながら特徴系列のフリップ戦略を導入する。
さらに,キーポイント分布の均一なカバレッジと空間的多様性を実現するために,表面損失と分離損失を設計する。
生成されたキーポイントは最終的に標準空間にマッピングされ、オブジェクトの6Dポーズとサイズを後退させる。
CAMERA25、REAL275、HouseCat6Dの大規模な実験は、INKL-Poseが最先端の性能を達成し、既存の手法よりも大幅に優れていることを示した。
関連論文リスト
- Universal Features Guided Zero-Shot Category-Level Object Pose Estimation [52.29006019352873]
カテゴリレベルの6-DOFオブジェクトのポーズ推定を実現するゼロショット手法を提案する。
提案手法は,入力RGB-D画像の2次元と3次元の普遍的特徴を利用して,意味的類似性に基づく対応性を確立する。
提案手法は,REAL275およびWild6Dベンチマークにおいて,未知のカテゴリに対して従来手法よりも優れていた。
論文 参考訳(メタデータ) (2025-01-06T08:10:13Z) - Instance-Adaptive and Geometric-Aware Keypoint Learning for Category-Level 6D Object Pose Estimation [38.03793706479096]
カテゴリーレベルの6Dオブジェクトのポーズ推定は、特定のカテゴリ内の見えないインスタンスの回転、翻訳、サイズを推定することを目的としている。
カテゴリレベルの6次元オブジェクトポーズ推定(AG-Pose)のための新しいインスタンス適応型および幾何学的キーポイント学習法を提案する。
提案した AG-Pose は、カテゴリー固有の形状の先行を伴わず、最先端の手法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2024-03-28T16:02:03Z) - SecondPose: SE(3)-Consistent Dual-Stream Feature Fusion for Category-Level Pose Estimation [79.12683101131368]
カテゴリーレベルのオブジェクトのポーズ推定は、既知のカテゴリから6次元のポーズと3次元の大きさを予測することを目的としている。
我々は、DINOv2のセマンティックカテゴリにオブジェクト固有の幾何学的特徴を統合する新しいアプローチであるSecondPoseを提案する。
論文 参考訳(メタデータ) (2023-11-18T17:14:07Z) - SOCS: Semantically-aware Object Coordinate Space for Category-Level 6D
Object Pose Estimation under Large Shape Variations [12.348551686086255]
カテゴリーレベルの6Dポーズ推定に対する学習に基づくほとんどのアプローチは、正規化オブジェクト座標空間(NOCS)を中心に設計されている。
本稿では,意味的に意味のある対応を持つキーポイントのスパースセットによって導かれるオブジェクトをワープ・アンド・アライメントすることで,セマンティック・アウェアなオブジェクトコーディネート・スペース(SOCS)を提案する。
論文 参考訳(メタデータ) (2023-03-18T06:34:16Z) - Generative Category-Level Shape and Pose Estimation with Semantic
Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。
カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。
提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文 参考訳(メタデータ) (2022-10-03T17:51:54Z) - Pose for Everything: Towards Category-Agnostic Pose Estimation [93.07415325374761]
Category-Agnostic Pose Estimation (CAPE) は、キーポイント定義を持つ少数のサンプルのみを与えられた任意の種類のオブジェクトのポーズを検出することができるポーズ推定モデルを作成することを目的としている。
異なるキーポイント間のインタラクションと、サポートとクエリイメージの関係をキャプチャするために、トランスフォーマーベースのキーポイントインタラクションモジュール(KIM)を提案する。
また、20K以上のインスタンスを含む100のオブジェクトカテゴリの2次元ポーズデータセットであるMP-100データセットを導入し、CAPEアルゴリズムの開発に適している。
論文 参考訳(メタデータ) (2022-07-21T09:40:54Z) - On Hyperbolic Embeddings in 2D Object Detection [76.12912000278322]
双曲幾何学が対象分類空間の基盤構造に適合するかどうかを考察する。
2段階、キーポイントベース、トランスフォーマーベースオブジェクト検出アーキテクチャに双曲型分類器を組み込む。
分類空間の構造に現れる分類階級階層を観察し、分類誤差を低くし、全体的な対象検出性能を高める。
論文 参考訳(メタデータ) (2022-03-15T16:43:40Z) - GPV-Pose: Category-level Object Pose Estimation via Geometry-guided
Point-wise Voting [103.74918834553249]
GPV-Poseはロバストなカテゴリーレベルのポーズ推定のための新しいフレームワークである。
幾何学的洞察を利用して、カテゴリーレベルのポーズ感応的特徴の学習を強化する。
一般的な公開ベンチマークにおいて、最先端の競合相手に優れた結果をもたらす。
論文 参考訳(メタデータ) (2022-03-15T13:58:50Z) - Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文 参考訳(メタデータ) (2020-07-06T15:59:56Z) - Category-Level Articulated Object Pose Estimation [34.57672805595464]
我々はArticulation-Aware Normalized Space Hierarchy (ANCSH)を紹介する。
ANCSHは、与えられたカテゴリ内の異なる明瞭なオブジェクトに対する標準表現である。
我々は,単一深度点クラウドからANCSHを予測するPointNet++に基づくディープネットワークを開発する。
論文 参考訳(メタデータ) (2019-12-26T18:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。