論文の概要: CosyPose: Consistent multi-view multi-object 6D pose estimation
- arxiv url: http://arxiv.org/abs/2008.08465v1
- Date: Wed, 19 Aug 2020 14:11:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 12:09:56.845081
- Title: CosyPose: Consistent multi-view multi-object 6D pose estimation
- Title(参考訳): CosyPose: 一貫性のあるマルチビューマルチオブジェクト6Dポーズ推定
- Authors: Yann Labb\'e, Justin Carpentier, Mathieu Aubry, Josef Sivic
- Abstract要約: 単視点単体6次元ポーズ推定法を提案し、6次元オブジェクトのポーズ仮説を生成する。
第2に、異なる入力画像間で個々の6次元オブジェクトのポーズをマッチングするロバストな手法を開発する。
第3に、複数のオブジェクト仮説とそれらの対応性を考慮したグローバルなシーン改善手法を開発した。
- 参考スコア(独自算出の注目度): 48.097599674329004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce an approach for recovering the 6D pose of multiple known objects
in a scene captured by a set of input images with unknown camera viewpoints.
First, we present a single-view single-object 6D pose estimation method, which
we use to generate 6D object pose hypotheses. Second, we develop a robust
method for matching individual 6D object pose hypotheses across different input
images in order to jointly estimate camera viewpoints and 6D poses of all
objects in a single consistent scene. Our approach explicitly handles object
symmetries, does not require depth measurements, is robust to missing or
incorrect object hypotheses, and automatically recovers the number of objects
in the scene. Third, we develop a method for global scene refinement given
multiple object hypotheses and their correspondences across views. This is
achieved by solving an object-level bundle adjustment problem that refines the
poses of cameras and objects to minimize the reprojection error in all views.
We demonstrate that the proposed method, dubbed CosyPose, outperforms current
state-of-the-art results for single-view and multi-view 6D object pose
estimation by a large margin on two challenging benchmarks: the YCB-Video and
T-LESS datasets. Code and pre-trained models are available on the project
webpage https://www.di.ens.fr/willow/research/cosypose/.
- Abstract(参考訳): カメラの視点が不明な入力画像の集合によって捉えられたシーンにおいて,複数の既知の物体の6次元ポーズを復元する手法を提案する。
まず, 単視点単体6次元ポーズ推定法を提案し, この手法を用いて6次元オブジェクトのポーズ推定を行う。
第2に、複数の入力画像にまたがる個々の6dオブジェクトのポーズを一致させるロバストな方法を開発し、カメラ視点と6dポーズを単一の一貫したシーンで共同で推定する。
提案手法は,オブジェクト対称性を明示的に処理し,深さ測定を必要とせず,不適切なオブジェクト仮説に対して頑健であり,シーン内のオブジェクト数を自動的に復元する。
第3に、複数のオブジェクト仮説とそれらの対応性を考慮したグローバルなシーン改善手法を開発した。
これは、すべてのビューにおける再投影誤差を最小限に抑えるために、カメラやオブジェクトのポーズを洗練するオブジェクトレベルのバンドル調整問題を解決することで達成される。
提案手法は,YCB-Video と T-LESS の2つのベンチマークにおいて,一視点および多視点の6Dオブジェクトに対して,現在最先端の結果よりも高い精度で推定できることを示す。
コードと事前トレーニングされたモデルは、プロジェクトwebページhttps://www.di.ens.fr/willow/research/cosypose/で入手できる。
関連論文リスト
- LocaliseBot: Multi-view 3D object localisation with differentiable
rendering for robot grasping [9.690844449175948]
オブジェクトのポーズ推定に重点を置いています。
このアプローチは,オブジェクトの複数ビュー,それらの視点におけるカメラのパラメータ,オブジェクトの3次元CADモデルという3つの情報に依存している。
推定対象のポーズが99.65%の精度で真理把握候補を把握できることが示される。
論文 参考訳(メタデータ) (2023-11-14T14:27:53Z) - ZS6D: Zero-shot 6D Object Pose Estimation using Vision Transformers [9.899633398596672]
ゼロショット新規オブジェクト6Dのポーズ推定にZS6Dを導入する。
事前訓練された視覚変換器(ViT)を用いて抽出された視覚ディスクリプタは、レンダリングテンプレートのマッチングに使用される。
LMO、YCBV、TLESSデータセットで実験が行われる。
論文 参考訳(メタデータ) (2023-09-21T11:53:01Z) - Rigidity-Aware Detection for 6D Object Pose Estimation [60.88857851869196]
最近の6Dオブジェクトのポーズ推定方法は、最初にオブジェクト検出を使用して2Dバウンディングボックスを取得し、実際にポーズを回帰する。
本研究では,6次元ポーズ推定において対象物体が剛性であるという事実を利用した剛性認識検出手法を提案する。
このアプローチの成功の鍵となるのは可視性マップであり、これは境界ボックス内の各ピクセルとボックス境界の間の最小障壁距離を用いて構築することを提案する。
論文 参考訳(メタデータ) (2023-03-22T09:02:54Z) - MV6D: Multi-View 6D Pose Estimation on RGB-D Frames Using a Deep
Point-wise Voting Network [14.754297065772676]
MV6Dと呼ばれる新しい多視点6Dポーズ推定手法を提案する。
我々は、ターゲットオブジェクトのキーポイントを予測するために単一のRGB-D画像を使用するPVN3Dネットワークをベースとしています。
CosyPoseのような現在の多視点ポーズ検出ネットワークとは対照的に、MV6Dはエンドツーエンドで複数の視点の融合を学習することができる。
論文 参考訳(メタデータ) (2022-08-01T23:34:43Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - Weakly Supervised Learning of Keypoints for 6D Object Pose Estimation [73.40404343241782]
2次元キーポイント検出に基づく弱教師付き6次元オブジェクトポーズ推定手法を提案する。
提案手法は,最先端の完全教師付きアプローチと同等の性能を実現する。
論文 参考訳(メタデータ) (2022-03-07T16:23:47Z) - CenterSnap: Single-Shot Multi-Object 3D Shape Reconstruction and
Categorical 6D Pose and Size Estimation [19.284468553414918]
本稿では, 単視点RGB-D観測による同時多目的3次元再構成, 6次元ポーズ, サイズ推定の複雑な課題について検討する。
既存のアプローチは主に、イメージ内の各オブジェクトインスタンスをローカライズして検出し、3Dメッシュまたは6Dポーズに回帰する複雑なマルチステージパイプラインに従う。
本研究では,3次元形状の予測と6次元ポーズと大きさの同時推定を,バウンディングボックスフリーで行うための簡単な一段階的手法を提案する。
論文 参考訳(メタデータ) (2022-03-03T18:59:04Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。