論文の概要: iCaps: Iterative Category-level Object Pose and Shape Estimation
- arxiv url: http://arxiv.org/abs/2201.00059v1
- Date: Fri, 31 Dec 2021 21:15:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 03:07:43.845273
- Title: iCaps: Iterative Category-level Object Pose and Shape Estimation
- Title(参考訳): iCaps: 反復カテゴリーレベルのオブジェクトポースと形状推定
- Authors: Xinke Deng, Junyi Geng, Timothy Bretl, Yu Xiang and Dieter Fox
- Abstract要約: 本稿では,カテゴリレベルの6次元オブジェクトポーズと形状推定手法iCapsを提案する。
入力として深度画像を用いたカテゴリレベルのオートエンコーダネットワークを開発した。
オブジェクトのポーズを推定すると、3次元形状の潜在表現を推定するために、LatentNetを構築します。
- 参考スコア(独自算出の注目度): 45.88520132529789
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a category-level 6D object pose and shape estimation
approach iCaps, which allows tracking 6D poses of unseen objects in a category
and estimating their 3D shapes. We develop a category-level auto-encoder
network using depth images as input, where feature embeddings from the
auto-encoder encode poses of objects in a category. The auto-encoder can be
used in a particle filter framework to estimate and track 6D poses of objects
in a category. By exploiting an implicit shape representation based on signed
distance functions, we build a LatentNet to estimate a latent representation of
the 3D shape given the estimated pose of an object. Then the estimated pose and
shape can be used to update each other in an iterative way. Our category-level
6D object pose and shape estimation pipeline only requires 2D detection and
segmentation for initialization. We evaluate our approach on a publicly
available dataset and demonstrate its effectiveness. In particular, our method
achieves comparably high accuracy on shape estimation.
- Abstract(参考訳): 本稿では, カテゴリーレベルの6次元物体ポーズと形状推定アプローチ icaps を提案し, カテゴリー内の未知覚物体の6次元ポーズを追跡し, それらの3次元形状を推定する。
深度画像を入力として用いたカテゴリレベルのオートエンコーダネットワークを開発し,カテゴリ内のオブジェクトのポーズを自動エンコーダエンコーダエンコーダエンコーダから特徴埋め込みする。
オートエンコーダは、カテゴリ内のオブジェクトの6Dポーズを推定および追跡するために、パーティクルフィルタフレームワークで使用することができる。
符号付き距離関数に基づく暗黙的な形状表現を利用することで、オブジェクトの推定されたポーズから3次元形状の潜在表現を推定するために、LatentNetを構築する。
そして、推定されたポーズと形状を使って反復的にお互いを更新することができる。
カテゴリレベルの6Dオブジェクトのポーズと形状推定パイプラインは初期化のための2D検出とセグメンテーションのみを必要とする。
公開データセット上でのアプローチを評価し,その効果を実証する。
特に,本手法は形状推定における高い精度を実現する。
関連論文リスト
- LocaliseBot: Multi-view 3D object localisation with differentiable
rendering for robot grasping [9.690844449175948]
オブジェクトのポーズ推定に重点を置いています。
このアプローチは,オブジェクトの複数ビュー,それらの視点におけるカメラのパラメータ,オブジェクトの3次元CADモデルという3つの情報に依存している。
推定対象のポーズが99.65%の精度で真理把握候補を把握できることが示される。
論文 参考訳(メタデータ) (2023-11-14T14:27:53Z) - Neural Correspondence Field for Object Pose Estimation [67.96767010122633]
1枚のRGB画像から3次元モデルで剛体物体の6DoFポーズを推定する手法を提案する。
入力画像の画素で3次元オブジェクト座標を予測する古典的対応法とは異なり,提案手法はカメラフラストラムでサンプリングされた3次元クエリポイントで3次元オブジェクト座標を予測する。
論文 参考訳(メタデータ) (2022-07-30T01:48:23Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - Weakly Supervised Learning of Keypoints for 6D Object Pose Estimation [73.40404343241782]
2次元キーポイント検出に基づく弱教師付き6次元オブジェクトポーズ推定手法を提案する。
提案手法は,最先端の完全教師付きアプローチと同等の性能を実現する。
論文 参考訳(メタデータ) (2022-03-07T16:23:47Z) - Leveraging SE(3) Equivariance for Self-Supervised Category-Level Object
Pose Estimation [30.04752448942084]
カテゴリーレベルのオブジェクトポーズ推定は、オブジェクトCADモデルにアクセスすることなく、既知のカテゴリから未確認のオブジェクトインスタンスの6Dオブジェクトポーズを見つけることを目的としている。
本研究では,1つの3次元点群からカテゴリレベルの6次元オブジェクトのポーズを推定する自己教師型学習フレームワークを初めて提案する。
論文 参考訳(メタデータ) (2021-10-30T06:46:44Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z) - Learning Canonical Shape Space for Category-Level 6D Object Pose and
Size Estimation [21.7030393344051]
我々は、ある対象カテゴリの多種多様なインスタンスに対する統一表現である標準形状空間(CASS)を学習する。
RGBD画像から標準空間の3次元点雲を生成するための変分自動エンコーダ(VAE)を訓練する。
VAEはクロスカテゴリな方法でトレーニングされており、公開されている大規模な3D形状リポジトリを活用している。
論文 参考訳(メタデータ) (2020-01-25T14:16:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。