論文の概要: CenterSnap: Single-Shot Multi-Object 3D Shape Reconstruction and
Categorical 6D Pose and Size Estimation
- arxiv url: http://arxiv.org/abs/2203.01929v1
- Date: Thu, 3 Mar 2022 18:59:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 15:58:48.785259
- Title: CenterSnap: Single-Shot Multi-Object 3D Shape Reconstruction and
Categorical 6D Pose and Size Estimation
- Title(参考訳): CenterSnap:シングルショットマルチオブジェクト3D形状再構成とカテゴリー6D画像とサイズ推定
- Authors: Muhammad Zubair Irshad, Thomas Kollar, Michael Laskey, Kevin Stone,
Zsolt Kira
- Abstract要約: 本稿では, 単視点RGB-D観測による同時多目的3次元再構成, 6次元ポーズ, サイズ推定の複雑な課題について検討する。
既存のアプローチは主に、イメージ内の各オブジェクトインスタンスをローカライズして検出し、3Dメッシュまたは6Dポーズに回帰する複雑なマルチステージパイプラインに従う。
本研究では,3次元形状の予測と6次元ポーズと大きさの同時推定を,バウンディングボックスフリーで行うための簡単な一段階的手法を提案する。
- 参考スコア(独自算出の注目度): 19.284468553414918
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper studies the complex task of simultaneous multi-object 3D
reconstruction, 6D pose and size estimation from a single-view RGB-D
observation. In contrast to instance-level pose estimation, we focus on a more
challenging problem where CAD models are not available at inference time.
Existing approaches mainly follow a complex multi-stage pipeline which first
localizes and detects each object instance in the image and then regresses to
either their 3D meshes or 6D poses. These approaches suffer from
high-computational cost and low performance in complex multi-object scenarios,
where occlusions can be present. Hence, we present a simple one-stage approach
to predict both the 3D shape and estimate the 6D pose and size jointly in a
bounding-box free manner. In particular, our method treats object instances as
spatial centers where each center denotes the complete shape of an object along
with its 6D pose and size. Through this per-pixel representation, our approach
can reconstruct in real-time (40 FPS) multiple novel object instances and
predict their 6D pose and sizes in a single-forward pass. Through extensive
experiments, we demonstrate that our approach significantly outperforms all
shape completion and categorical 6D pose and size estimation baselines on
multi-object ShapeNet and NOCS datasets respectively with a 12.6% absolute
improvement in mAP for 6D pose for novel real-world object instances.
- Abstract(参考訳): 本稿では, 単視点RGB-D観測による同時多目的3次元再構成, 6次元ポーズ, サイズ推定の複雑な課題について検討する。
インスタンスレベルのポーズ推定とは対照的に,cadモデルが推論時に利用できない,より困難な問題に注目する。
既存のアプローチは主に、イメージ内の各オブジェクトインスタンスをローカライズして検出し、3Dメッシュまたは6Dポーズに回帰する複雑なマルチステージパイプラインに従う。
これらのアプローチは、オクルージョンが存在する複雑なマルチオブジェクトシナリオにおいて、高い計算コストと低いパフォーマンスに苦しむ。
そこで,本研究では,3次元形状と6次元ポーズとサイズを共に有界自由な方法で推定する一段階的手法を提案する。
特に,オブジェクトインスタンスを空間中心として扱い,各センタが物体の完全な形状と6次元のポーズと大きさを示す。
このピクセル単位の表現を通じて、複数の新しいオブジェクトインスタンスをリアルタイム(40fps)に再構築し、6dのポーズとサイズを単一のフォワードパスで予測することができる。
提案手法は,複数オブジェクトのShapeNetデータセットとNOCSデータセットに対して,新しい実世界のオブジェクトインスタンスに対するmAPの12.6%の絶対的な改善とともに,すべての形状完了とカテゴリー6Dポーズおよびサイズ推定ベースラインを著しく上回ることを示す。
関連論文リスト
- FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - MV6D: Multi-View 6D Pose Estimation on RGB-D Frames Using a Deep
Point-wise Voting Network [14.754297065772676]
MV6Dと呼ばれる新しい多視点6Dポーズ推定手法を提案する。
我々は、ターゲットオブジェクトのキーポイントを予測するために単一のRGB-D画像を使用するPVN3Dネットワークをベースとしています。
CosyPoseのような現在の多視点ポーズ検出ネットワークとは対照的に、MV6Dはエンドツーエンドで複数の視点の融合を学習することができる。
論文 参考訳(メタデータ) (2022-08-01T23:34:43Z) - ShAPO: Implicit Representations for Multi-Object Shape, Appearance, and
Pose Optimization [40.36229450208817]
SAPO, 関節多物体検出法, 3次元テクスチャ再構築法, 6次元オブジェクトポーズ法, サイズ推定法を提案する。
ShAPOのキーはシングルショットのパイプラインで、各オブジェクトインスタンスのマスクとともに、形状、外観、遅延コードのポーズをレグレッションする。
提案手法は,NOCSデータセット上でのベースライン全体の性能を,6次元ポーズ推定におけるmAPの8%の絶対的な改善で著しく向上させる。
論文 参考訳(メタデータ) (2022-07-27T17:59:31Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。
本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文 参考訳(メタデータ) (2022-03-28T10:31:29Z) - Learning Stereopsis from Geometric Synthesis for 6D Object Pose
Estimation [11.999630902627864]
現在のモノクラーベース6Dオブジェクトポーズ推定法は、一般的にRGBDベースの手法よりも競争力の低い結果が得られる。
本稿では,短いベースライン2ビュー設定による3次元幾何体積に基づくポーズ推定手法を提案する。
実験により,本手法は最先端の単分子法よりも優れ,異なる物体やシーンにおいて堅牢であることが示された。
論文 参考訳(メタデータ) (2021-09-25T02:55:05Z) - CosyPose: Consistent multi-view multi-object 6D pose estimation [48.097599674329004]
単視点単体6次元ポーズ推定法を提案し、6次元オブジェクトのポーズ仮説を生成する。
第2に、異なる入力画像間で個々の6次元オブジェクトのポーズをマッチングするロバストな手法を開発する。
第3に、複数のオブジェクト仮説とそれらの対応性を考慮したグローバルなシーン改善手法を開発した。
論文 参考訳(メタデータ) (2020-08-19T14:11:56Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z) - CPS++: Improving Class-level 6D Pose and Shape Estimation From Monocular
Images With Self-Supervised Learning [74.53664270194643]
現代のモノクロ6Dポーズ推定手法は、少数のオブジェクトインスタンスにしか対応できない。
そこで本研究では,計量形状検索と組み合わせて,クラスレベルのモノクル6次元ポーズ推定手法を提案する。
1枚のRGB画像から正確な6Dポーズとメートル法形状を抽出できることを実験的に実証した。
論文 参考訳(メタデータ) (2020-03-12T15:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。