論文の概要: Spatial Attention Improves Iterative 6D Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2101.01659v1
- Date: Tue, 5 Jan 2021 17:18:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 11:33:59.975268
- Title: Spatial Attention Improves Iterative 6D Object Pose Estimation
- Title(参考訳): 空間的注意が反復的6次元物体ポーズ推定を改善する
- Authors: Stefan Stevsic, Otmar Hilliges
- Abstract要約: 本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
- 参考スコア(独自算出の注目度): 52.365075652976735
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of estimating the 6D pose of an object from RGB images can be broken
down into two main steps: an initial pose estimation step, followed by a
refinement procedure to correctly register the object and its observation. In
this paper, we propose a new method for 6D pose estimation refinement from RGB
images. To achieve high accuracy of the final estimate, the observation and a
rendered model need to be aligned. Our main insight is that after the initial
pose estimate, it is important to pay attention to distinct spatial features of
the object in order to improve the estimation accuracy during alignment.
Furthermore, parts of the object that are occluded in the image should be given
less weight during the alignment process. Most state-of-the-art refinement
approaches do not allow for this fine-grained reasoning and can not fully
leverage the structure of the problem. In contrast, we propose a novel neural
network architecture built around a spatial attention mechanism that identifies
and leverages information about spatial details during pose refinement. We
experimentally show that this approach learns to attend to salient spatial
features and learns to ignore occluded parts of the object, leading to better
pose estimation across datasets. We conduct experiments on standard benchmark
datasets for 6D pose estimation (LineMOD and Occlusion LineMOD) and outperform
previous state-of-the-art methods.
- Abstract(参考訳): RGB画像からオブジェクトの6Dポーズを推定するタスクは、初期ポーズ推定ステップと、オブジェクトとその観察を正しく登録する精細化手順の2つの主要なステップに分割することができる。
本稿では,RGB画像からの6次元ポーズ推定補正手法を提案する。
最終的な推定値の精度を高めるためには、観測とレンダリングモデルを調整する必要がある。
我々の主な洞察は、最初のポーズ推定の後、アライメント中の推定精度を向上させるために、物体の異なる空間的特徴に注意を払うことが重要であることである。
さらに、画像に隠されたオブジェクトの部分は、アライメントプロセス中に、より少ない重量で与えられるべきである。
ほとんどの最先端の洗練されたアプローチは、このきめ細かい推論を許さず、問題の構造を完全に活用できない。
対照的に、ポーズリファインメント中の空間的詳細情報を特定し、活用する空間的注意機構を中心に構築された新しいニューラルネットワークアーキテクチャを提案する。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
我々は6次元ポーズ推定のための標準ベンチマークデータセット(LineMODとOcclusion LineMOD)の実験を行い、従来の最先端手法よりも優れていた。
関連論文リスト
- End-to-End Probabilistic Geometry-Guided Regression for 6DoF Object Pose Estimation [5.21401636701889]
最先端の6Dオブジェクトのポーズ推定器は、オブジェクト観察によってオブジェクトのポーズを直接予測する。
最先端アルゴリズムGDRNPPを再構成し,EPRO-GDRを導入する。
提案手法は,1つのポーズではなく1つのポーズ分布を予測することで,最先端の単一ビューのポーズ推定を改善することができることを示す。
論文 参考訳(メタデータ) (2024-09-18T09:11:31Z) - Rigidity-Aware Detection for 6D Object Pose Estimation [60.88857851869196]
最近の6Dオブジェクトのポーズ推定方法は、最初にオブジェクト検出を使用して2Dバウンディングボックスを取得し、実際にポーズを回帰する。
本研究では,6次元ポーズ推定において対象物体が剛性であるという事実を利用した剛性認識検出手法を提案する。
このアプローチの成功の鍵となるのは可視性マップであり、これは境界ボックス内の各ピクセルとボックス境界の間の最小障壁距離を用いて構築することを提案する。
論文 参考訳(メタデータ) (2023-03-22T09:02:54Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z) - PrimA6D: Rotational Primitive Reconstruction for Enhanced and Robust 6D
Pose Estimation [11.873744190924599]
本稿では,1つの画像を入力として,回転プリミティブに基づく6次元オブジェクトポーズ推定を提案する。
変分オートエンコーダ(VAE)を利用して、基礎となるプリミティブとその関連するキーポイントを学習する。
公開データセットに対して評価すると,LINEMOD,Occlusion LINEMOD,およびY誘発データセットよりも顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-06-14T03:55:42Z) - Self6D: Self-Supervised Monocular 6D Object Pose Estimation [114.18496727590481]
自己教師付き学習による単眼6次元ポーズ推定のアイデアを提案する。
ニューラルレンダリングの最近の進歩を活用して、注釈のない実RGB-Dデータのモデルをさらに自己監督する。
論文 参考訳(メタデータ) (2020-04-14T13:16:36Z) - Object 6D Pose Estimation with Non-local Attention [29.929911622127502]
本研究では,オブジェクト検出フレームワークに6次元オブジェクトポーズパラメータ推定を組み込むネットワークを提案する。
提案手法は,YCB- VideoおよびLinemodデータセット上での最先端性能に到達する。
論文 参考訳(メタデータ) (2020-02-20T14:23:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。