論文の概要: A Review on Object Pose Recovery: from 3D Bounding Box Detectors to Full
6D Pose Estimators
- arxiv url: http://arxiv.org/abs/2001.10609v2
- Date: Sun, 19 Apr 2020 11:59:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 02:41:48.396281
- Title: A Review on Object Pose Recovery: from 3D Bounding Box Detectors to Full
6D Pose Estimators
- Title(参考訳): オブジェクト・ポース・リカバリに関するレビュー:3Dバウンディング・ボックス・ディテクタからフル6D・ポース・エミュレータへ
- Authors: Caner Sahin, Guillermo Garcia-Hernando, Juil Sock, Tae-Kyun Kim
- Abstract要約: 本稿では,オブジェクトポーズ回復手法の総合的および最新のレビューについて紹介する。
それらの手法は、問題を分類、回帰、分類と回帰、テンプレートマッチング、ポイントペア特徴マッチングタスクとして数学的にモデル化する。
- 参考スコア(独自算出の注目度): 40.049600223903546
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object pose recovery has gained increasing attention in the computer vision
field as it has become an important problem in rapidly evolving technological
areas related to autonomous driving, robotics, and augmented reality. Existing
review-related studies have addressed the problem at visual level in 2D, going
through the methods which produce 2D bounding boxes of objects of interest in
RGB images. The 2D search space is enlarged either using the geometry
information available in the 3D space along with RGB (Mono/Stereo) images, or
utilizing depth data from LIDAR sensors and/or RGB-D cameras. 3D bounding box
detectors, producing category-level amodal 3D bounding boxes, are evaluated on
gravity aligned images, while full 6D object pose estimators are mostly tested
at instance-level on the images where the alignment constraint is removed.
Recently, 6D object pose estimation is tackled at the level of categories. In
this paper, we present the first comprehensive and most recent review of the
methods on object pose recovery, from 3D bounding box detectors to full 6D pose
estimators. The methods mathematically model the problem as a classification,
regression, classification & regression, template matching, and point-pair
feature matching task. Based on this, a mathematical-model-based categorization
of the methods is established. Datasets used for evaluating the methods are
investigated with respect to the challenges, and evaluation metrics are
studied. Quantitative results of experiments in the literature are analyzed to
show which category of methods best performs across what types of challenges.
The analyses are further extended comparing two methods, which are our own
implementations, so that the outcomes from the public results are further
solidified. Current position of the field is summarized regarding object pose
recovery, and possible research directions are identified.
- Abstract(参考訳): オブジェクトポーズの回復は、自動運転、ロボティクス、拡張現実に関連する技術分野の急速な発展において重要な問題となり、コンピュータビジョンの分野で注目を集めている。
既存のレビュー関連研究では、RGB画像に注目するオブジェクトの2D境界ボックスを生成する方法を通じて、2Dの視覚レベルでこの問題に対処している。
2次元探索空間は、RGB(Mono/Stereo)画像とともに3次元空間で利用可能な幾何学情報を使用するか、LIDARセンサやRGB-Dカメラからの深度データを利用するかで拡大される。
3dバウンディングボックス検出器(カテゴリーレベルのアモーダル3dバウンディングボックス)は重力アライメント画像上で評価され、完全な6dオブジェクトポーズ推定器はアライメント制約が取り除かれた画像のインスタンスレベルでテストされる。
近年,6次元オブジェクトのポーズ推定がカテゴリレベルで行われている。
本稿では,3次元境界ボックス検出器から全6次元ポーズ推定器まで,対象ポーズ復元法に関する最初の包括的かつ最新のレビューを行う。
それらの手法は、問題を分類、回帰、分類と回帰、テンプレートマッチング、ポイントペア特徴マッチングタスクとして数学的にモデル化する。
これに基づいて、数学的モデルに基づく手法の分類が確立される。
手法の評価に用いるデータセットを課題として検討し、評価指標について検討する。
文献における実験の結果を定量的に分析し、どの手法がどのタイプの課題に最も適しているかを示す。
分析は、我々の実装である2つの方法と比較してさらに拡張され、公的な結果から得られる結果はさらに固まる。
オブジェクトポーズ回復に関して、フィールドの現在位置を要約し、可能な研究方向を特定する。
関連論文リスト
- Open Vocabulary Monocular 3D Object Detection [10.424711580213616]
RGB画像から3次元空間内の物体を検出しローカライズすることを目的とした新しい課題であるオープンボキャブラリモノクロ3Dオブジェクト検出の研究を開拓した。
オープンボキャブラリ2次元検出器を活用して2次元境界ボックスを3次元空間に持ち上げるクラス非依存的手法を提案する。
提案手法は,3次元境界ボックスを推定する作業から2次元の物体の認識と局所化を分離し,未知のカテゴリをまたいだ一般化を可能にする。
論文 参考訳(メタデータ) (2024-11-25T18:59:17Z) - Rigidity-Aware Detection for 6D Object Pose Estimation [60.88857851869196]
最近の6Dオブジェクトのポーズ推定方法は、最初にオブジェクト検出を使用して2Dバウンディングボックスを取得し、実際にポーズを回帰する。
本研究では,6次元ポーズ推定において対象物体が剛性であるという事実を利用した剛性認識検出手法を提案する。
このアプローチの成功の鍵となるのは可視性マップであり、これは境界ボックス内の各ピクセルとボックス境界の間の最小障壁距離を用いて構築することを提案する。
論文 参考訳(メタデータ) (2023-03-22T09:02:54Z) - Monocular 3D Object Detection with Depth from Motion [74.29588921594853]
我々は、正確な物体深度推定と検出にカメラエゴモーションを利用する。
我々のフレームワークはDfM(Depth from Motion)と呼ばれ、2D画像の特徴を3D空間に持ち上げて3Dオブジェクトを検出する。
我々のフレームワークは、KITTIベンチマークにおいて最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-07-26T15:48:46Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - Pose Estimation of Specific Rigid Objects [0.7931904787652707]
本稿では,RGBまたはRGB-D入力画像から剛体物体の6次元ポーズを推定する問題に対処する。
この問題は、ロボット操作、拡張現実、自律運転など、多くの応用分野において非常に重要である。
論文 参考訳(メタデータ) (2021-12-30T14:36:47Z) - Learning Stereopsis from Geometric Synthesis for 6D Object Pose
Estimation [11.999630902627864]
現在のモノクラーベース6Dオブジェクトポーズ推定法は、一般的にRGBDベースの手法よりも競争力の低い結果が得られる。
本稿では,短いベースライン2ビュー設定による3次元幾何体積に基づくポーズ推定手法を提案する。
実験により,本手法は最先端の単分子法よりも優れ,異なる物体やシーンにおいて堅牢であることが示された。
論文 参考訳(メタデータ) (2021-09-25T02:55:05Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Geometry-aware data augmentation for monocular 3D object detection [18.67567745336633]
本稿では,自動運転システムにおける必須モジュールの一つであるモノキュラー3次元物体検出について述べる。
重要な課題は、深さ回復問題は単眼データに不備があることです。
我々は,既存の手法が,異なる幾何学的シフトが発生した場合の深さをロバストに推定できないことを明らかにするために,詳細な解析を行う。
上記の操作を,対応する4つの3D対応データ拡張手法に変換する。
論文 参考訳(メタデータ) (2021-04-12T23:12:48Z) - Single View Metrology in the Wild [94.7005246862618]
本研究では,物体の3次元の高さや地上のカメラの高さで表現されるシーンの絶対的なスケールを再現する,単一ビューメロジに対する新しいアプローチを提案する。
本手法は,被写体の高さなどの3Dエンティティによる未知のカメラとの相互作用から,弱い教師付き制約を抑えるために設計されたディープネットワークによって学習されたデータ駆動の先行情報に依存する。
いくつかのデータセットと仮想オブジェクト挿入を含むアプリケーションに対して、最先端の定性的かつ定量的な結果を示す。
論文 参考訳(メタデータ) (2020-07-18T22:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。