論文の概要: THE-Pose: Topological Prior with Hybrid Graph Fusion for Estimating Category-Level 6D Object Pose
- arxiv url: http://arxiv.org/abs/2512.10251v1
- Date: Thu, 11 Dec 2025 03:19:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.179127
- Title: THE-Pose: Topological Prior with Hybrid Graph Fusion for Estimating Category-Level 6D Object Pose
- Title(参考訳): The-Pose: Category-Level 6D Object Pose 推定のためのハイブリッドグラフフュージョン
- Authors: Eunho Lee, Chaehyeon Song, Seunghoon Jeong, Ayoung Kim,
- Abstract要約: カテゴリーレベルのオブジェクトポーズ推定は、クラス内の変動に対してロバスト性を確保するために、大域的コンテキストと局所構造の両方を必要とする。
The-Poseは、表面埋め込みとハイブリッドグラフ融合によるトポロジ的事前情報を活用する新しいカテゴリレベルの6次元ポーズ推定フレームワークである。
我々のHybrid Graph Fusion(HGF)モジュールは、トポロジ的特徴とポイントクラウドの特徴を適応的に統合し、2D画像コンテキストと3D幾何学的構造をシームレスにブリッジする。
- 参考スコア(独自算出の注目度): 7.409836711400794
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Category-level object pose estimation requires both global context and local structure to ensure robustness against intra-class variations. However, 3D graph convolution (3D-GC) methods only focus on local geometry and depth information, making them vulnerable to complex objects and visual ambiguities. To address this, we present THE-Pose, a novel category-level 6D pose estimation framework that leverages a topological prior via surface embedding and hybrid graph fusion. Specifically, we extract consistent and invariant topological features from the image domain, effectively overcoming the limitations inherent in existing 3D-GC based methods. Our Hybrid Graph Fusion (HGF) module adaptively integrates the topological features with point-cloud features, seamlessly bridging 2D image context and 3D geometric structure. These fused features ensure stability for unseen or complicated objects, even under significant occlusions. Extensive experiments on the REAL275 dataset show that THE-Pose achieves a 35.8% improvement over the 3D-GC baseline (HS-Pose) and surpasses the previous state-of-the-art by 7.2% across all key metrics. The code is avaialbe on https://github.com/EHxxx/THE-Pose
- Abstract(参考訳): カテゴリーレベルのオブジェクトポーズ推定は、クラス内の変動に対してロバスト性を確保するために、大域的コンテキストと局所構造の両方を必要とする。
しかし、3Dグラフ畳み込み(3D-GC)法は局所幾何学と深度情報のみに焦点を当て、複雑な物体や視覚的曖昧さに弱い。
そこで本研究では,表面埋め込みとハイブリッドグラフ融合によるトポロジ的事前情報を活用する,カテゴリレベルの6次元ポーズ推定フレームワークThe-Poseを提案する。
具体的には、画像領域から一貫した不変な位相的特徴を抽出し、既存の3D-GC法に固有の制約を効果的に克服する。
我々のHybrid Graph Fusion(HGF)モジュールは、トポロジ的特徴とポイントクラウドの特徴を適応的に統合し、2D画像コンテキストと3D幾何学的構造をシームレスにブリッジする。
これらの融合した特徴は、重大な閉塞の下でも、目に見えない、または複雑な物体の安定性を保証する。
REAL275データセットの大規模な実験は、The-Poseが3D-GCベースライン(HS-Pose)よりも35.8%改善し、すべての主要な指標で以前の最先端を7.2%上回っていることを示している。
the code is avaialbe on https://github.com/EHxxx/THE-Pose
関連論文リスト
- SecondPose: SE(3)-Consistent Dual-Stream Feature Fusion for Category-Level Pose Estimation [79.12683101131368]
カテゴリーレベルのオブジェクトのポーズ推定は、既知のカテゴリから6次元のポーズと3次元の大きさを予測することを目的としている。
我々は、DINOv2のセマンティックカテゴリにオブジェクト固有の幾何学的特徴を統合する新しいアプローチであるSecondPoseを提案する。
論文 参考訳(メタデータ) (2023-11-18T17:14:07Z) - HS-Pose: Hybrid Scope Feature Extraction for Category-level Object Pose
Estimation [28.405005252559146]
本稿では,3D-GCを拡張したシンプルなネットワーク構造HS層を提案する。
提案するHS層は,1)局所的グローバルな幾何学構造とグローバルな情報,2)ノイズに頑健で,3)サイズや翻訳情報をエンコードできる。
実験の結果,ベースライン法(GPV-Pose)における3D-GC層とHS層を簡易に置き換えることにより,大幅な改善が得られた。
論文 参考訳(メタデータ) (2023-03-28T05:36:42Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - GPV-Pose: Category-level Object Pose Estimation via Geometry-guided
Point-wise Voting [103.74918834553249]
GPV-Poseはロバストなカテゴリーレベルのポーズ推定のための新しいフレームワークである。
幾何学的洞察を利用して、カテゴリーレベルのポーズ感応的特徴の学習を強化する。
一般的な公開ベンチマークにおいて、最先端の競合相手に優れた結果をもたらす。
論文 参考訳(メタデータ) (2022-03-15T13:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。