論文の概要: EfficientPose: An efficient, accurate and scalable end-to-end 6D multi
object pose estimation approach
- arxiv url: http://arxiv.org/abs/2011.04307v2
- Date: Wed, 18 Nov 2020 10:47:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 01:27:57.699718
- Title: EfficientPose: An efficient, accurate and scalable end-to-end 6D multi
object pose estimation approach
- Title(参考訳): efficientpose: 効率的で正確でスケーラブルなエンドツーエンドの6dマルチオブジェクトポーズ推定アプローチ
- Authors: Yannick Bukschat, Marcus Vetter
- Abstract要約: 6次元オブジェクトのポーズ推定のための新しいアプローチであるEfficientPoseを紹介する。
非常に正確で、効率的で、幅広い計算資源に対してスケーラブルである。
複数のオブジェクトやインスタンスの2Dバウンディングボックスを検出したり、ひとつのショットで完全な6Dポーズを推定することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we introduce EfficientPose, a new approach for 6D object pose
estimation. Our method is highly accurate, efficient and scalable over a wide
range of computational resources. Moreover, it can detect the 2D bounding box
of multiple objects and instances as well as estimate their full 6D poses in a
single shot. This eliminates the significant increase in runtime when dealing
with multiple objects other approaches suffer from. These approaches aim to
first detect 2D targets, e.g. keypoints, and solve a Perspective-n-Point
problem for their 6D pose for each object afterwards. We also propose a novel
augmentation method for direct 6D pose estimation approaches to improve
performance and generalization, called 6D augmentation. Our approach achieves a
new state-of-the-art accuracy of 97.35% in terms of the ADD(-S) metric on the
widely-used 6D pose estimation benchmark dataset Linemod using RGB input, while
still running end-to-end at over 27 FPS. Through the inherent handling of
multiple objects and instances and the fused single shot 2D object detection as
well as 6D pose estimation, our approach runs even with multiple objects
(eight) end-to-end at over 26 FPS, making it highly attractive to many real
world scenarios. Code will be made publicly available at
https://github.com/ybkscht/EfficientPose.
- Abstract(参考訳): 本稿では、6次元オブジェクトのポーズ推定のための新しいアプローチであるEfficientPoseを紹介する。
提案手法は,幅広い計算資源に対して精度が高く,効率的かつスケーラブルである。
さらに、複数のオブジェクトやインスタンスの2Dバウンディングボックスを検出し、ひとつのショットで完全な6Dポーズを見積もることができる。
これにより、他のアプローチが抱える複数のオブジェクトを扱う際のランタイムの大幅な増加が排除される。
これらのアプローチは、まずキーポイントなどの2Dターゲットを検出し、その後、各オブジェクトに対する6Dポーズに対するパースペクティブ-n-Point問題を解決することを目的としている。
また,直接6次元ポーズ推定手法の新たな拡張手法を提案し,性能向上と一般化を図っている。
提案手法は,RGB入力を用いた6次元ポーズ推定ベンチマークデータセットLinemodにおけるADD(-S)測定値の97.35%の新たな精度を実現するとともに,27FPS以上のエンド・ツー・エンド動作を実現している。
複数のオブジェクトとインスタンスの固有の処理と、融合したシングルショット2dオブジェクト検出と6dポーズ推定を通じて、複数のオブジェクト(8)のエンドツーエンドでも26fps以上で動作し、多くの現実世界シナリオに非常に魅力的です。
コードはhttps://github.com/ybkscht/EfficientPose.comで公開される。
関連論文リスト
- Rigidity-Aware Detection for 6D Object Pose Estimation [60.88857851869196]
最近の6Dオブジェクトのポーズ推定方法は、最初にオブジェクト検出を使用して2Dバウンディングボックスを取得し、実際にポーズを回帰する。
本研究では,6次元ポーズ推定において対象物体が剛性であるという事実を利用した剛性認識検出手法を提案する。
このアプローチの成功の鍵となるのは可視性マップであり、これは境界ボックス内の各ピクセルとボックス境界の間の最小障壁距離を用いて構築することを提案する。
論文 参考訳(メタデータ) (2023-03-22T09:02:54Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - Weakly Supervised Learning of Keypoints for 6D Object Pose Estimation [73.40404343241782]
2次元キーポイント検出に基づく弱教師付き6次元オブジェクトポーズ推定手法を提案する。
提案手法は,最先端の完全教師付きアプローチと同等の性能を実現する。
論文 参考訳(メタデータ) (2022-03-07T16:23:47Z) - SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation [98.83762558394345]
SO-Poseは、オブジェクトの6自由度(6DoF)をすべて、単一のRGBイメージから散らばった環境でポーズさせるフレームワークである。
本稿では,3次元オブジェクトの2層表現を確立するために,自己閉塞に関する新たな推論を導入する。
対応性,自己閉塞性,6次元ポーズを整列する層間合成により,精度とロバスト性をさらに向上させることができる。
論文 参考訳(メタデータ) (2021-08-18T19:49:29Z) - CosyPose: Consistent multi-view multi-object 6D pose estimation [48.097599674329004]
単視点単体6次元ポーズ推定法を提案し、6次元オブジェクトのポーズ仮説を生成する。
第2に、異なる入力画像間で個々の6次元オブジェクトのポーズをマッチングするロバストな手法を開発する。
第3に、複数のオブジェクト仮説とそれらの対応性を考慮したグローバルなシーン改善手法を開発した。
論文 参考訳(メタデータ) (2020-08-19T14:11:56Z) - Single Shot 6D Object Pose Estimation [11.37625512264302]
深度画像に基づく剛体物体の6次元オブジェクトポーズ推定のための新しい単一ショット手法を提案する。
完全な畳み込みニューラルネットワークを用い、3次元入力データを空間的に離散化し、ポーズ推定を回帰タスクとみなす。
GPU上の65fpsでは、Object Pose Network(OP-Net)は非常に高速で、エンドツーエンドに最適化され、画像内の複数のオブジェクトの6Dポーズを同時に推定する。
論文 参考訳(メタデータ) (2020-04-27T11:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。