論文の概要: Disentangled Implicit Shape and Pose Learning for Scalable 6D Pose
Estimation
- arxiv url: http://arxiv.org/abs/2107.12549v1
- Date: Tue, 27 Jul 2021 01:55:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 14:43:37.039381
- Title: Disentangled Implicit Shape and Pose Learning for Scalable 6D Pose
Estimation
- Title(参考訳): スケーラブルな6次元ポーズ推定のための絡み合った暗黙的形状とポーズ学習
- Authors: Yilin Wen, Xiangyu Li, Hao Pan, Lei Yang, Zheng Wang, Taku Komura,
Wenping Wang
- Abstract要約: 単一オートエンコーダを用いた複数オブジェクトの合成データに対する自己教師付き学習により,スケーラブルな6次元ポーズ推定のための新しい手法を提案する。
提案手法は,T-LESS と NOCS REAL275 という実データを持つ2つのマルチオブジェクトベンチマークで検証し,ポーズ推定精度と一般化の点で既存の RGB 法より優れていることを示す。
- 参考スコア(独自算出の注目度): 44.8872454995923
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 6D pose estimation of rigid objects from a single RGB image has seen
tremendous improvements recently by using deep learning to combat complex
real-world variations, but a majority of methods build models on the per-object
level, failing to scale to multiple objects simultaneously. In this paper, we
present a novel approach for scalable 6D pose estimation, by self-supervised
learning on synthetic data of multiple objects using a single autoencoder. To
handle multiple objects and generalize to unseen objects, we disentangle the
latent object shape and pose representations, so that the latent shape space
models shape similarities, and the latent pose code is used for rotation
retrieval by comparison with canonical rotations. To encourage shape space
construction, we apply contrastive metric learning and enable the processing of
unseen objects by referring to similar training objects. The different
symmetries across objects induce inconsistent latent pose spaces, which we
capture with a conditioned block producing shape-dependent pose codebooks by
re-entangling shape and pose representations. We test our method on two
multi-object benchmarks with real data, T-LESS and NOCS REAL275, and show it
outperforms existing RGB-based methods in terms of pose estimation accuracy and
generalization.
- Abstract(参考訳): 単一のRGB画像からの剛体物体の6Dポーズ推定は、最近、複雑な実世界の変動に対処するためにディープラーニングを使用することで大幅に改善されているが、ほとんどの手法はオブジェクト単位のモデルを構築し、同時に複数のオブジェクトにスケールできない。
本稿では,単一オートエンコーダを用いた複数オブジェクトの合成データに対する自己教師付き学習により,スケーラブルな6次元ポーズ推定手法を提案する。
複数のオブジェクトを処理し、未確認オブジェクトに一般化するために、潜時オブジェクトの形状とポーズの表現を分離し、潜時形状空間が類似性をモデル化し、潜時ポーズ符号を正準回転と比較して回転検索に使用する。
形状空間の構築を促進するため,対照的な距離学習を適用し,類似の訓練対象を参照して見えない物体の処理を可能にする。
オブジェクト間の異なる対称性は矛盾しないポーズ空間を誘導し、形状に依存したポーズコードブックを生成する条件付きブロックでキャプチャする。
提案手法は,T-LESS と NOCS REAL275 という実データを持つ2つのマルチオブジェクトベンチマークで検証し,ポーズ推定精度と一般化の点で既存の RGB 法より優れていることを示す。
関連論文リスト
- Generalizable Single-view Object Pose Estimation by Two-side Generating and Matching [19.730504197461144]
本稿では,RGB画像のみを用いてオブジェクトのポーズを決定するために,新しい一般化可能なオブジェクトポーズ推定手法を提案する。
本手法は,オブジェクトの参照画像1枚で操作し,3次元オブジェクトモデルやオブジェクトの複数ビューの必要性を解消する。
論文 参考訳(メタデータ) (2024-11-24T14:31:50Z) - Object Pose Estimation Using Implicit Representation For Transparent Objects [0.0]
レンダリング・アンド・コンペア法は、オブジェクトを複数のビューからレンダリングし、与えられた2D画像と比較する。
物体がニューラルラジアンス場(NeRF)の形で暗黙(ニューラル)表現として表現されている場合、実際のシーンをよりリアルに表現できることが示される。
我々は、透過的なデータセット上でのレンダリング・アンド・コンペア法のNeRF実装を評価し、現在の最先端結果を上回る結果を得た。
論文 参考訳(メタデータ) (2024-10-17T11:51:12Z) - SABER-6D: Shape Representation Based Implicit Object Pose Estimation [15.744920692895919]
埋め込み空間におけるオブジェクトの6次元ポーズを学習するために,SABERという新しいエンコーダデコーダアーキテクチャを提案する。
2次元画像に基づく物体の回転空間の学習を支援する補助タスクとして形状表現を行う。
論文 参考訳(メタデータ) (2024-08-11T21:59:34Z) - FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - Generative Category-Level Shape and Pose Estimation with Semantic
Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。
カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。
提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文 参考訳(メタデータ) (2022-10-03T17:51:54Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z) - CPS++: Improving Class-level 6D Pose and Shape Estimation From Monocular
Images With Self-Supervised Learning [74.53664270194643]
現代のモノクロ6Dポーズ推定手法は、少数のオブジェクトインスタンスにしか対応できない。
そこで本研究では,計量形状検索と組み合わせて,クラスレベルのモノクル6次元ポーズ推定手法を提案する。
1枚のRGB画像から正確な6Dポーズとメートル法形状を抽出できることを実験的に実証した。
論文 参考訳(メタデータ) (2020-03-12T15:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。