論文の概要: Unseen Object 6D Pose Estimation: A Benchmark and Baselines
- arxiv url: http://arxiv.org/abs/2206.11808v1
- Date: Thu, 23 Jun 2022 16:29:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-24 14:11:30.348955
- Title: Unseen Object 6D Pose Estimation: A Benchmark and Baselines
- Title(参考訳): Unseen Object 6D Pose Estimation: ベンチマークとベースライン
- Authors: Minghao Gou, Haolin Pan, Hao-Shu Fang, Ziyuan Liu, Cewu Lu, Ping Tan
- Abstract要約: 本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
- 参考スコア(独自算出の注目度): 62.8809734237213
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating the 6D pose for unseen objects is in great demand for many
real-world applications. However, current state-of-the-art pose estimation
methods can only handle objects that are previously trained. In this paper, we
propose a new task that enables and facilitates algorithms to estimate the 6D
pose estimation of novel objects during testing. We collect a dataset with both
real and synthetic images and up to 48 unseen objects in the test set. In the
mean while, we propose a new metric named Infimum ADD (IADD) which is an
invariant measurement for objects with different types of pose ambiguity. A
two-stage baseline solution for this task is also provided. By training an
end-to-end 3D correspondences network, our method finds corresponding points
between an unseen object and a partial view RGBD image accurately and
efficiently. It then calculates the 6D pose from the correspondences using an
algorithm robust to object symmetry. Extensive experiments show that our method
outperforms several intuitive baselines and thus verify its effectiveness. All
the data, code and models will be made publicly available. Project page:
www.graspnet.net/unseen6d
- Abstract(参考訳): 見えないオブジェクトに対する6dのポーズの推定は、多くの実世界のアプリケーションにとって大きな需要である。
しかし、現在の最先端のポーズ推定手法は、以前に訓練されたオブジェクトのみを扱うことができる。
本稿では,テスト中の新規物体の6次元ポーズ推定をアルゴリズムにより推定し,提案するタスクを提案する。
テストセット内の実画像と合成画像の両方と48個の未認識オブジェクトでデータセットを収集します。
平均的に、異なる種類のポーズあいさを持つ対象に対する不変測定であるInfimum ADD (IADD) という新しい計量を提案する。
このタスクのための2段階のベースラインソリューションも提供される。
エンド・ツー・エンドの3d対応ネットワークを訓練することにより、対象物と部分表示rgbd画像との対応点を正確にかつ効率的に見つける。
そして、オブジェクト対称性に頑健なアルゴリズムを用いて、対応から6Dポーズを計算する。
実験の結果,本手法は直感的ベースラインよりも優れており,その有効性が検証された。
すべてのデータ、コード、モデルは公開される予定だ。
プロジェクトページ:www.graspnet.net/unseen6d
関連論文リスト
- ZS6D: Zero-shot 6D Object Pose Estimation using Vision Transformers [9.899633398596672]
ゼロショット新規オブジェクト6Dのポーズ推定にZS6Dを導入する。
事前訓練された視覚変換器(ViT)を用いて抽出された視覚ディスクリプタは、レンダリングテンプレートのマッチングに使用される。
LMO、YCBV、TLESSデータセットで実験が行われる。
論文 参考訳(メタデータ) (2023-09-21T11:53:01Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - NOPE: Novel Object Pose Estimation from a Single Image [67.11073133072527]
本稿では,新しいオブジェクトの1つのイメージを入力として取り込んで,オブジェクトの3Dモデルに関する事前知識を必要とせずに,新しいイメージにおけるオブジェクトの相対的なポーズを予測するアプローチを提案する。
我々は、オブジェクトを取り巻く視点に対する識別的埋め込みを直接予測するモデルを訓練することで、これを実現する。
この予測は単純なU-Netアーキテクチャを用いて行われ、要求されたポーズに注意を向け、条件を定め、非常に高速な推論をもたらす。
論文 参考訳(メタデータ) (2023-03-23T18:55:43Z) - LocPoseNet: Robust Location Prior for Unseen Object Pose Estimation [69.70498875887611]
LocPoseNetは、見えないオブジェクトに先立って、ロバストにロケーションを学習することができる。
提案手法は,LINEMOD と GenMOP において,既存の作業よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-29T15:21:34Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - ZebraPose: Coarse to Fine Surface Encoding for 6DoF Object Pose
Estimation [76.31125154523056]
物体表面を高密度に表現できる離散ディスクリプタを提案する。
また,微粒化対応予測が可能な微粒化学習戦略を提案する。
論文 参考訳(メタデータ) (2022-03-17T16:16:24Z) - NeRF-Pose: A First-Reconstruct-Then-Regress Approach for
Weakly-supervised 6D Object Pose Estimation [44.42449011619408]
トレーニング中に2次元オブジェクトセグメンテーションと既知の相対カメラポーズしか必要としないNeRF-Poseという,弱教師付き再構築型パイプラインを提案する。
予測応答から安定かつ正確なポーズを推定するために、NeRF対応RAN+SACアルゴリズムを用いる。
LineMod-Occlusion 実験の結果,提案手法は6次元ポーズ推定法と比較して最先端の精度を持つことがわかった。
論文 参考訳(メタデータ) (2022-03-09T15:28:02Z) - EfficientPose: An efficient, accurate and scalable end-to-end 6D multi
object pose estimation approach [0.0]
6次元オブジェクトのポーズ推定のための新しいアプローチであるEfficientPoseを紹介する。
非常に正確で、効率的で、幅広い計算資源に対してスケーラブルである。
複数のオブジェクトやインスタンスの2Dバウンディングボックスを検出したり、ひとつのショットで完全な6Dポーズを推定することができる。
論文 参考訳(メタデータ) (2020-11-09T10:23:55Z) - Single Shot 6D Object Pose Estimation [11.37625512264302]
深度画像に基づく剛体物体の6次元オブジェクトポーズ推定のための新しい単一ショット手法を提案する。
完全な畳み込みニューラルネットワークを用い、3次元入力データを空間的に離散化し、ポーズ推定を回帰タスクとみなす。
GPU上の65fpsでは、Object Pose Network(OP-Net)は非常に高速で、エンドツーエンドに最適化され、画像内の複数のオブジェクトの6Dポーズを同時に推定する。
論文 参考訳(メタデータ) (2020-04-27T11:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。