論文の概要: ShAPO: Implicit Representations for Multi-Object Shape, Appearance, and
Pose Optimization
- arxiv url: http://arxiv.org/abs/2207.13691v1
- Date: Wed, 27 Jul 2022 17:59:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-28 13:15:23.776092
- Title: ShAPO: Implicit Representations for Multi-Object Shape, Appearance, and
Pose Optimization
- Title(参考訳): ShAPO:多目的形状, 外観, 姿勢最適化のための暗黙表現
- Authors: Muhammad Zubair Irshad, Sergey Zakharov, Rares Ambrus, Thomas Kollar,
Zsolt Kira, Adrien Gaidon
- Abstract要約: SAPO, 関節多物体検出法, 3次元テクスチャ再構築法, 6次元オブジェクトポーズ法, サイズ推定法を提案する。
ShAPOのキーはシングルショットのパイプラインで、各オブジェクトインスタンスのマスクとともに、形状、外観、遅延コードのポーズをレグレッションする。
提案手法は,NOCSデータセット上でのベースライン全体の性能を,6次元ポーズ推定におけるmAPの8%の絶対的な改善で著しく向上させる。
- 参考スコア(独自算出の注目度): 40.36229450208817
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our method studies the complex task of object-centric 3D understanding from a
single RGB-D observation. As it is an ill-posed problem, existing methods
suffer from low performance for both 3D shape and 6D pose and size estimation
in complex multi-object scenarios with occlusions. We present ShAPO, a method
for joint multi-object detection, 3D textured reconstruction, 6D object pose
and size estimation. Key to ShAPO is a single-shot pipeline to regress shape,
appearance and pose latent codes along with the masks of each object instance,
which is then further refined in a sparse-to-dense fashion. A novel
disentangled shape and appearance database of priors is first learned to embed
objects in their respective shape and appearance space. We also propose a
novel, octree-based differentiable optimization step, allowing us to further
improve object shape, pose and appearance simultaneously under the learned
latent space, in an analysis-by-synthesis fashion. Our novel joint implicit
textured object representation allows us to accurately identify and reconstruct
novel unseen objects without having access to their 3D meshes. Through
extensive experiments, we show that our method, trained on simulated indoor
scenes, accurately regresses the shape, appearance and pose of novel objects in
the real-world with minimal fine-tuning. Our method significantly out-performs
all baselines on the NOCS dataset with an 8% absolute improvement in mAP for 6D
pose estimation. Project page:
https://zubair-irshad.github.io/projects/ShAPO.html
- Abstract(参考訳): 一つのRGB-D観測からオブジェクト中心の3次元理解の複雑な課題を考察する。
既往の手法では3次元形状と6次元ポーズの両面において, 閉塞を伴う複雑な多対象シナリオにおいて, 低性能に悩まされている。
SAPO, 関節多物体検出法, 3次元テクスチャ再構築法, 6次元オブジェクトポーズ法, サイズ推定法を提案する。
ShAPOのキーはシングルショットパイプラインで、各オブジェクトインスタンスのマスクとともに、形状、外観、潜時符号を後退させ、さらにスパース・トゥ・ディエンスな方法で洗練する。
先駆者の新しい異方形および外観データベースをまず学習し、それぞれの形状及び外観空間にオブジェクトを埋め込む。
また,新しいオクツリーに基づく微分可能最適化手法を提案し,学習された潜在空間下でのオブジェクトの形状,ポーズ,外観を,解析的に解析的に改善する。
目に見える新しいオブジェクトを3次元メッシュにアクセスすることなく正確に識別し、再構築することができる。
室内シーンをシミュレートしたシミュレーションにより,実世界の新しい物体の形状,外観,ポーズを最小限の微調整で正確に再現できることを示す。
提案手法は6次元ポーズ推定のためのマップの絶対値が8%向上し,nocsデータセットのベースラインを著しく上回っている。
プロジェクトページ: https://zubair-irshad.github.io/projects/shapo.html
関連論文リスト
- 3D Surface Reconstruction in the Wild by Deforming Shape Priors from
Synthetic Data [24.97027425606138]
1枚の画像から被写体の3次元表面を再構築することは難しい問題である。
本稿では,1枚の画像から3次元合成とオブジェクトポーズ推定を行う新しい手法を提案する。
提案手法は,複数の実世界のデータセットにまたがって,最先端の再構築性能を実現する。
論文 参考訳(メタデータ) (2023-02-24T20:37:27Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - Generative Category-Level Shape and Pose Estimation with Semantic
Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。
カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。
提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文 参考訳(メタデータ) (2022-10-03T17:51:54Z) - FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。
本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文 参考訳(メタデータ) (2022-03-28T10:31:29Z) - CenterSnap: Single-Shot Multi-Object 3D Shape Reconstruction and
Categorical 6D Pose and Size Estimation [19.284468553414918]
本稿では, 単視点RGB-D観測による同時多目的3次元再構成, 6次元ポーズ, サイズ推定の複雑な課題について検討する。
既存のアプローチは主に、イメージ内の各オブジェクトインスタンスをローカライズして検出し、3Dメッシュまたは6Dポーズに回帰する複雑なマルチステージパイプラインに従う。
本研究では,3次元形状の予測と6次元ポーズと大きさの同時推定を,バウンディングボックスフリーで行うための簡単な一段階的手法を提案する。
論文 参考訳(メタデータ) (2022-03-03T18:59:04Z) - Learning Stereopsis from Geometric Synthesis for 6D Object Pose
Estimation [11.999630902627864]
現在のモノクラーベース6Dオブジェクトポーズ推定法は、一般的にRGBDベースの手法よりも競争力の低い結果が得られる。
本稿では,短いベースライン2ビュー設定による3次元幾何体積に基づくポーズ推定手法を提案する。
実験により,本手法は最先端の単分子法よりも優れ,異なる物体やシーンにおいて堅牢であることが示された。
論文 参考訳(メタデータ) (2021-09-25T02:55:05Z) - Neural Articulated Radiance Field [90.91714894044253]
本稿では,画像から学習した明瞭な物体に対する新しい変形可能な3次元表現であるニューラルArticulated Radiance Field(NARF)を提案する。
実験の結果,提案手法は効率的であり,新しいポーズにうまく一般化できることがわかった。
論文 参考訳(メタデータ) (2021-04-07T13:23:14Z) - From Points to Multi-Object 3D Reconstruction [71.17445805257196]
単一のRGB画像から複数の3Dオブジェクトを検出し再構成する方法を提案する。
キーポイント検出器は、オブジェクトを中心点としてローカライズし、9-DoF境界ボックスや3D形状を含む全てのオブジェクト特性を直接予測する。
提示されたアプローチは、軽量な再構築を単一ステージで実行し、リアルタイム能力を持ち、完全に微分可能で、エンドツーエンドのトレーナーブルである。
論文 参考訳(メタデータ) (2020-12-21T18:52:21Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。