論文の概要: Mask6D: Masked Pose Priors For 6D Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2507.06486v1
- Date: Wed, 09 Jul 2025 02:06:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.438306
- Title: Mask6D: Masked Pose Priors For 6D Object Pose Estimation
- Title(参考訳): Mask6D:masked Poseが6DオブジェクトのPose推定に先行
- Authors: Yuechen Xie, Haobo Jiang, Jin Xie,
- Abstract要約: そこで我々はMask6Dというポーズ推定型事前学習戦略を提案する。
提案手法は2D-3D対応マップと可視マスクマップを付加的なモーダル情報として組み込んだものである。
提案手法は,従来のポーズ推定手法よりも優れていた。
- 参考スコア(独自算出の注目度): 12.600659693194874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robust 6D object pose estimation in cluttered or occluded conditions using monocular RGB images remains a challenging task. One reason is that current pose estimation networks struggle to extract discriminative, pose-aware features using 2D feature backbones, especially when the available RGB information is limited due to target occlusion in cluttered scenes. To mitigate this, we propose a novel pose estimation-specific pre-training strategy named Mask6D. Our approach incorporates pose-aware 2D-3D correspondence maps and visible mask maps as additional modal information, which is combined with RGB images for the reconstruction-based model pre-training. Essentially, this 2D-3D correspondence maps a transformed 3D object model to 2D pixels, reflecting the pose information of the target in camera coordinate system. Meanwhile, the integrated visible mask map can effectively guide our model to disregard cluttered background information. In addition, an object-focused pre-training loss function is designed to further facilitate our network to remove the background interference. Finally, we fine-tune our pre-trained pose prior-aware network via conventional pose training strategy to realize the reliable pose prediction. Extensive experiments verify that our method outperforms previous end-to-end pose estimation methods.
- Abstract(参考訳): 単眼RGB画像を用いた乱れ・隠蔽条件下でのロバスト6Dオブジェクトのポーズ推定は依然として困難な課題である。
一つの理由は、現在のポーズ推定ネットワークが2D特徴バックボーンを用いて差別的でポーズ対応の特徴を抽出するのに苦労しているためである。
そこで本研究では,Mask6Dというポーズ推定型事前学習戦略を提案する。
提案手法では,ポーズ対応2D-3D対応マップと可視マスクマップを付加的なモーダル情報として組み込んで,再構成モデル事前学習のためのRGB画像と組み合わせた。
基本的に、この2D-3D対応は、カメラ座標系におけるターゲットのポーズ情報を反映して、変換された3Dオブジェクトモデルを2Dピクセルにマッピングする。
一方、統合された可視マスクマップは、乱雑な背景情報を無視するために、我々のモデルを効果的にガイドすることができる。
さらに,対象物に着目した事前学習損失関数を設計し,ネットワークの背景干渉の除去を容易にする。
最後に、従来のポーズトレーニング戦略を介して事前学習したポーズネットワークを微調整し、信頼性の高いポーズ予測を実現する。
実験により,提案手法が従来のポーズ推定手法より優れていることを確認した。
関連論文リスト
- UA-Pose: Uncertainty-Aware 6D Object Pose Estimation and Online Object Completion with Partial References [14.762839788171584]
6次元オブジェクトポーズ推定とオンラインオブジェクト補完のための不確実性を考慮したアプローチであるUA-Poseを提案する。
ロボットと人間の手によって操作されたYCBオブジェクトのRGBDシーケンスを含む,YCB-Video,YCBInEOAT,HO3Dデータセットについて評価を行った。
論文 参考訳(メタデータ) (2025-06-09T17:58:12Z) - Any6D: Model-free 6D Pose Estimation of Novel Objects [76.30057578269668]
我々は,6次元オブジェクトのポーズ推定のためのモデルフリーフレームワークであるAny6Dを紹介する。
新たなシーンでは、未知の物体の6Dポーズと大きさを推定するために、1枚のRGB-Dアンカー画像しか必要としない。
提案手法を5つの挑戦的データセットで評価する。
論文 参考訳(メタデータ) (2025-03-24T13:46:21Z) - Pseudo Flow Consistency for Self-Supervised 6D Object Pose Estimation [14.469317161361202]
補助情報なしで純粋なRGB画像で訓練できる6次元オブジェクトポーズ推定法を提案する。
提案手法を3つの挑戦的データセット上で評価し,最先端の自己管理手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-19T13:52:18Z) - 3D Neural Embedding Likelihood: Probabilistic Inverse Graphics for
Robust 6D Pose Estimation [50.15926681475939]
逆グラフィックスは2次元画像から3次元シーン構造を推論することを目的としている。
確率モデルを導入し,不確実性を定量化し,6次元ポーズ推定タスクにおけるロバスト性を実現する。
3DNELは、RGBから学んだニューラルネットワークの埋め込みと深度情報を組み合わせることで、RGB-D画像からのsim-to-real 6Dオブジェクトのポーズ推定の堅牢性を向上させる。
論文 参考訳(メタデータ) (2023-02-07T20:48:35Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - NeRF-Pose: A First-Reconstruct-Then-Regress Approach for
Weakly-supervised 6D Object Pose Estimation [44.42449011619408]
トレーニング中に2次元オブジェクトセグメンテーションと既知の相対カメラポーズしか必要としないNeRF-Poseという,弱教師付き再構築型パイプラインを提案する。
予測応答から安定かつ正確なポーズを推定するために、NeRF対応RAN+SACアルゴリズムを用いる。
LineMod-Occlusion 実験の結果,提案手法は6次元ポーズ推定法と比較して最先端の精度を持つことがわかった。
論文 参考訳(メタデータ) (2022-03-09T15:28:02Z) - Weakly Supervised Learning of Keypoints for 6D Object Pose Estimation [73.40404343241782]
2次元キーポイント検出に基づく弱教師付き6次元オブジェクトポーズ推定手法を提案する。
提案手法は,最先端の完全教師付きアプローチと同等の性能を実現する。
論文 参考訳(メタデータ) (2022-03-07T16:23:47Z) - DSC-PoseNet: Learning 6DoF Object Pose Estimation via Dual-scale
Consistency [43.09728251735362]
2Dオブジェクト境界ボックスから6DoFオブジェクトポーズを得るための2ステップポーズ推定フレームワークを提案する。
最初のステップでは、フレームワークはオブジェクトを実際のデータと合成データからセグメンテーションすることを学ぶ。
第2のステップでは,dsc-posenetという,デュアルスケールなポーズ推定ネットワークを設計する。
提案手法は,合成データに基づいて訓練した最先端のモデルよりも大きなマージンで優れる。
論文 参考訳(メタデータ) (2021-04-08T10:19:35Z) - GDRNPP: A Geometry-guided and Fully Learning-based Object Pose Estimator [51.89441403642665]
剛体物体の6次元ポーズ推定はコンピュータビジョンにおける長年の課題である。
近年、ディープラーニングの出現は、信頼できる6Dポーズを予測するための畳み込みニューラルネットワーク(CNN)の可能性を明らかにしている。
本稿では,完全学習型オブジェクトポーズ推定器を提案する。
論文 参考訳(メタデータ) (2021-02-24T09:11:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。