論文の概要: ES6D: A Computation Efficient and Symmetry-Aware 6D Pose Regression
Framework
- arxiv url: http://arxiv.org/abs/2204.01080v1
- Date: Sun, 3 Apr 2022 14:04:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-05 15:29:29.179019
- Title: ES6D: A Computation Efficient and Symmetry-Aware 6D Pose Regression
Framework
- Title(参考訳): ES6D: 計算効率と対称性を考慮した6D Pose回帰フレームワーク
- Authors: Ningkai Mo and Wanshui Gan and Naoto Yokoya and Shifeng Chen
- Abstract要約: このフレームワークは、XYZNetと呼ばれる完全な畳み込みネットワークを用いて、RGB-Dデータからポイントワイズ機能を効率的に抽出するシンプルなアーキテクチャで設計されている。
YCB-VideoデータセットとT-LESSデータセットの実験は、提案フレームワークの最高精度と低計算コストにおいて、かなり優れた性能を示す。
- 参考スコア(独自算出の注目度): 19.759108851254844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, a computation efficient regression framework is presented for
estimating the 6D pose of rigid objects from a single RGB-D image, which is
applicable to handling symmetric objects. This framework is designed in a
simple architecture that efficiently extracts point-wise features from RGB-D
data using a fully convolutional network, called XYZNet, and directly regresses
the 6D pose without any post refinement. In the case of symmetric object, one
object has multiple ground-truth poses, and this one-to-many relationship may
lead to estimation ambiguity. In order to solve this ambiguity problem, we
design a symmetry-invariant pose distance metric, called average (maximum)
grouped primitives distance or A(M)GPD. The proposed A(M)GPD loss can make the
regression network converge to the correct state, i.e., all minima in the
A(M)GPD loss surface are mapped to the correct poses. Extensive experiments on
YCB-Video and T-LESS datasets demonstrate the proposed framework's
substantially superior performance in top accuracy and low computational cost.
- Abstract(参考訳): 本稿では,1枚のRGB-D画像から剛体物体の6次元ポーズを推定する計算効率のよい回帰フレームワークを提案する。
このフレームワークは、XYZNetと呼ばれる完全な畳み込みネットワークを使用して、RGB-Dデータからポイントワイズ機能を効率的に抽出するシンプルなアーキテクチャで設計され、後処理なしで直接6Dポーズを回帰する。
対称対象の場合、1つの対象は複数の接地真実のポーズを持ち、この1対多の関係は推定の曖昧さをもたらす。
この曖昧性問題を解決するために、平均(最大)グループプリミティブ距離(A(M)GPD)と呼ばれる対称性不変ポーズ距離計量を設計する。
提案したA(M)GPD損失は回帰ネットワークを正しい状態に収束させることができ、すなわち、A(M)GPD損失面のすべてのミニマを正しいポーズにマッピングする。
YCB-VideoデータセットとT-LESSデータセットの大規模な実験は、提案フレームワークの最高精度と低計算コストにおいて、かなり優れた性能を示す。
関連論文リスト
- Resolving Symmetry Ambiguity in Correspondence-based Methods for Instance-level Object Pose Estimation [5.821462441570274]
物体表面を1対多の対応に基づいて符号化する対称認識曲面であるSymCodeを提案する。
また、問題の解決なしにオブジェクトの6Dポーズパラメータを直接回帰する高速なエンドツーエンドネットワークであるSymNetについても紹介する。
論文 参考訳(メタデータ) (2024-05-17T05:48:56Z) - RDPN6D: Residual-based Dense Point-wise Network for 6Dof Object Pose Estimation Based on RGB-D Images [13.051302134031808]
単一のRGB-D画像を用いてオブジェクトの6DoFポーズを計算する新しい手法を提案する。
オブジェクトのポーズを直接予測する既存の手法や、ポーズ回復のためのスパースキーポイントに依存する既存の手法とは異なり、我々のアプローチは密度の高い対応を使ってこの課題に対処する。
論文 参考訳(メタデータ) (2024-05-14T10:10:45Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。
本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文 参考訳(メタデータ) (2022-03-28T10:31:29Z) - SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation [98.83762558394345]
SO-Poseは、オブジェクトの6自由度(6DoF)をすべて、単一のRGBイメージから散らばった環境でポーズさせるフレームワークである。
本稿では,3次元オブジェクトの2層表現を確立するために,自己閉塞に関する新たな推論を導入する。
対応性,自己閉塞性,6次元ポーズを整列する層間合成により,精度とロバスト性をさらに向上させることができる。
論文 参考訳(メタデータ) (2021-08-18T19:49:29Z) - GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D
Object Pose Estimation [71.83992173720311]
単一のRGB画像からの6次元ポーズ推定はコンピュータビジョンの基本課題である。
GDR-Net(Geometry-Guided Direct Regression Network)を用いて6Dポーズをエンドツーエンドで学習する。
提案手法は, LM, LM-O, YCB-Vデータセットの最先端手法よりも優れている。
論文 参考訳(メタデータ) (2021-02-24T09:11:31Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - se(3)-TrackNet: Data-driven 6D Pose Tracking by Calibrating Image
Residuals in Synthetic Domains [12.71983073907091]
本研究では,長期6次元ポーズトラッキングのためのデータ駆動型最適化手法を提案する。
本研究の目的は、現在のRGB-D観測と、前回の推定値と対象物のモデルに基づいて条件付けされた合成画像から、最適な相対的なポーズを特定することである。
提案手法は, 実画像を用いて訓練した場合でも, 常に頑健な評価を達成し, 代替品よりも優れる。
論文 参考訳(メタデータ) (2020-07-27T21:09:36Z) - Single Shot 6D Object Pose Estimation [11.37625512264302]
深度画像に基づく剛体物体の6次元オブジェクトポーズ推定のための新しい単一ショット手法を提案する。
完全な畳み込みニューラルネットワークを用い、3次元入力データを空間的に離散化し、ポーズ推定を回帰タスクとみなす。
GPU上の65fpsでは、Object Pose Network(OP-Net)は非常に高速で、エンドツーエンドに最適化され、画像内の複数のオブジェクトの6Dポーズを同時に推定する。
論文 参考訳(メタデータ) (2020-04-27T11:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。