論文の概要: 6D Pose Estimation via Keypoint Heatmap Regression with RGB-D Residual Neural Networks
- arxiv url: http://arxiv.org/abs/2605.08059v1
- Date: Fri, 08 May 2026 17:47:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.251928
- Title: 6D Pose Estimation via Keypoint Heatmap Regression with RGB-D Residual Neural Networks
- Title(参考訳): RGB-D残差ニューラルネットワークを用いたキーポイント熱マップ回帰による6次元空間推定
- Authors: Ismail Aljosevic, Amir Masoud Almasi, Ana Parovic, Ashkan Shafiei,
- Abstract要約: キーポイント・ヒートマップ・レグレッションに基づく6次元ポーズ推定のためのモジュラー・フレームワークを提案する。
RGB-D融合モデルの平均精度は84.50%、LINEMODデータセットでは92.41%に達した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a modular framework for 6D pose estimation based on keypoint heatmap regression. Our approach combines YOLOv10m for object detection with a ResNet18-based network that predicts 2D heatmaps from RGB images. Keypoints extracted from these heatmaps are used to estimate the 6D object pose via the PnP RANSAC algorithm. We compare different keypoint selection strategies to assess their impact on pose accuracy. Additionally, we extend the baseline by incorporating depth data using a cross-fusion architecture, which enables interaction between RGB and depth features at multiple stages. We further explore general training improvements, such as experimenting with activation functions and learning rate scheduling strategies to improve model performance. Our best RGB-only model achieved a mean ADD-based accuracy of 84.50%, while the RGB-D fusion model reached 92.41% on the LINEMOD dataset. The code is available at https://github.com/ameermasood/HeatNet.
- Abstract(参考訳): 本稿では,キーポイント・ヒートマップの回帰に基づく6次元ポーズ推定のためのモジュラー・フレームワークを提案する。
本稿では,オブジェクト検出のためのYOLOv10mとRGB画像から2次元ヒートマップを予測するResNet18ベースのネットワークを組み合わせる。
これらのヒートマップから抽出したキーポイントは、PnP RANSACアルゴリズムを介して6Dオブジェクトのポーズを推定するために使用される。
我々は、異なるキーポイント選択戦略を比較して、それらがポーズ精度に与える影響を評価する。
さらに,複数段階におけるRGBと深度特徴の相互作用を可能にするクロスフュージョンアーキテクチャを用いて,深度データを組み込むことにより,ベースラインを拡張した。
さらに、アクティベーション関数の実験や、モデル性能を改善するための学習率スケジューリング戦略など、一般的なトレーニングの改善についても検討する。
RGB-D融合モデルの平均精度は84.50%、LINEMODデータセットでは92.41%に達した。
コードはhttps://github.com/ameermasood/HeatNet.comで公開されている。
関連論文リスト
- DKPMV: Dense Keypoints Fusion from Multi-View RGB Frames for 6D Pose Estimation of Textureless Objects [18.011730388391232]
我々は,高密度キーポイントレベルの融合を実現するパイプラインDKPMVを提案する。
我々は,注目集約と対称性を考慮した学習により,キーポイントネットワークを強化した。
ROBIデータセットの実験により、DKPMVは最先端のマルチビューRGBアプローチより優れていることが示された。
論文 参考訳(メタデータ) (2025-10-13T02:45:55Z) - CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image [86.75098349480014]
本稿では,ロボット操作作業における調音物体のカテゴリーレベルのポーズ推定に取り組む。
そこで本研究では,Categorical Articulated Partsの6次元ポーズとサイズを推定するためのシングルステージネットワークCAP-Netを提案する。
我々は,RGB画像と実センサからシミュレーションした深度雑音を特徴とするRGB-D調音データセットであるRGBD-Artデータセットを紹介した。
論文 参考訳(メタデータ) (2025-04-15T14:30:26Z) - RDPN6D: Residual-based Dense Point-wise Network for 6Dof Object Pose Estimation Based on RGB-D Images [13.051302134031808]
単一のRGB-D画像を用いてオブジェクトの6DoFポーズを計算する新しい手法を提案する。
オブジェクトのポーズを直接予測する既存の手法や、ポーズ回復のためのスパースキーポイントに依存する既存の手法とは異なり、我々のアプローチは密度の高い対応を使ってこの課題に対処する。
論文 参考訳(メタデータ) (2024-05-14T10:10:45Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - A Combined Approach Toward Consistent Reconstructions of Indoor Spaces
Based on 6D RGB-D Odometry and KinectFusion [7.503338065129185]
キーポイント抽出により連続したRGB-Dフレーム間の相対的なカメラポーズを求める6次元RGB-Dオドメトリー手法を提案する。
推定されたポーズを、フレーム間相対的なポーズを微調整するKinectFusionアルゴリズムに入力する。
提案アルゴリズムは,ポストプロセッシングのステップを使わずに,利用可能なポリゴンメッシュ(3次元仮想世界を作成するのに非常に適している)を出力する。
論文 参考訳(メタデータ) (2022-12-25T22:52:25Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。