論文の概要: 3D Object Detection and Pose Estimation of Unseen Objects in Color
Images with Local Surface Embeddings
- arxiv url: http://arxiv.org/abs/2010.04075v1
- Date: Thu, 8 Oct 2020 15:57:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 12:34:53.810895
- Title: 3D Object Detection and Pose Estimation of Unseen Objects in Color
Images with Local Surface Embeddings
- Title(参考訳): 局所面埋め込みカラー画像における3次元物体検出と非知覚物体のポーズ推定
- Authors: Giorgia Pitteri, Aur\'elie Bugeau, Slobodan Ilic, Vincent Lepetit
- Abstract要約: 本研究では, 画像中のオブジェクトの3次元ポーズを, テクスチャのないCADモデルでのみ検出し, 推定する手法を提案する。
我々のアプローチはディープラーニングと3D幾何を組み合わせており、CADモデルと入力画像とを一致させるために、局所的な3D幾何の埋め込みに依存している。
我々は,Mask-RCNNをクラスに依存しない方法で,再学習せずに新しい物体を検出できることを示す。
- 参考スコア(独自算出の注目度): 35.769234123059086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an approach for detecting and estimating the 3D poses of objects
in images that requires only an untextured CAD model and no training phase for
new objects. Our approach combines Deep Learning and 3D geometry: It relies on
an embedding of local 3D geometry to match the CAD models to the input images.
For points at the surface of objects, this embedding can be computed directly
from the CAD model; for image locations, we learn to predict it from the image
itself. This establishes correspondences between 3D points on the CAD model and
2D locations of the input images. However, many of these correspondences are
ambiguous as many points may have similar local geometries. We show that we can
use Mask-RCNN in a class-agnostic way to detect the new objects without
retraining and thus drastically limit the number of possible correspondences.
We can then robustly estimate a 3D pose from these discriminative
correspondences using a RANSAC- like algorithm. We demonstrate the performance
of this approach on the T-LESS dataset, by using a small number of objects to
learn the embedding and testing it on the other objects. Our experiments show
that our method is on par or better than previous methods.
- Abstract(参考訳): 本稿では,画像中のオブジェクトの3次元ポーズを非テキストcadモデルのみで検出し,新たなオブジェクトのトレーニングフェーズを必要とせずに推定する手法を提案する。
我々のアプローチはディープラーニングと3D幾何を組み合わせており、CADモデルと入力画像とのマッチングを局所的な3D幾何の埋め込みに依存している。
物体の表面上の点について、この埋め込みはCADモデルから直接計算することができる。
これにより、CADモデル上の3D点と入力画像の2D位置との対応性を確立する。
しかし、これらの対応の多くは、多くの点が同様の局所幾何学を持つため曖昧である。
mask-rcnnはクラスに依存しない方法で新しいオブジェクトを再トレーニングすることなく検出できるため、可能な対応数が大幅に制限される。
そして、RANSACのようなアルゴリズムを用いて、これらの識別的対応から3次元のポーズを頑健に推定できる。
我々は,T-LESSデータセット上で,少数のオブジェクトを用いて他のオブジェクトへの埋め込みとテストの学習を行うことにより,このアプローチの性能を実証する。
実験の結果,本手法は従来手法と同等かそれ以上であることがわかった。
関連論文リスト
- 3D Surface Reconstruction in the Wild by Deforming Shape Priors from
Synthetic Data [24.97027425606138]
1枚の画像から被写体の3次元表面を再構築することは難しい問題である。
本稿では,1枚の画像から3次元合成とオブジェクトポーズ推定を行う新しい手法を提案する。
提案手法は,複数の実世界のデータセットにまたがって,最先端の再構築性能を実現する。
論文 参考訳(メタデータ) (2023-02-24T20:37:27Z) - Neural Correspondence Field for Object Pose Estimation [67.96767010122633]
1枚のRGB画像から3次元モデルで剛体物体の6DoFポーズを推定する手法を提案する。
入力画像の画素で3次元オブジェクト座標を予測する古典的対応法とは異なり,提案手法はカメラフラストラムでサンプリングされた3次元クエリポイントで3次元オブジェクト座標を予測する。
論文 参考訳(メタデータ) (2022-07-30T01:48:23Z) - End-to-End Learning of Multi-category 3D Pose and Shape Estimation [128.881857704338]
本稿では,画像から2次元キーポイントを同時に検出し,それらを3次元に引き上げるエンド・ツー・エンド手法を提案する。
提案手法は2次元キーポイントアノテーションからのみ2次元検出と3次元リフトを学習する。
画像から3D学習へのエンドツーエンド化に加えて,1つのニューラルネットワークを用いて複数のカテゴリからのオブジェクトも処理する。
論文 参考訳(メタデータ) (2021-12-19T17:10:40Z) - AutoShape: Real-Time Shape-Aware Monocular 3D Object Detection [15.244852122106634]
形状認識型2D/3D制約を3D検出フレームワークに組み込む手法を提案する。
具体的には、ディープニューラルネットワークを用いて、2次元画像領域の区別された2Dキーポイントを学習する。
2D/3Dキーポイントの基礎的真理を生成するために、自動的なモデル適合手法が提案されている。
論文 参考訳(メタデータ) (2021-08-25T08:50:06Z) - Joint Deep Multi-Graph Matching and 3D Geometry Learning from
Inhomogeneous 2D Image Collections [57.60094385551773]
非均質な画像コレクションから変形可能な3Dジオメトリモデルを学ぶためのトレーニング可能なフレームワークを提案する。
さらに,2次元画像で表現された物体の3次元形状も取得する。
論文 参考訳(メタデータ) (2021-03-31T17:25:36Z) - 3D Object Recognition By Corresponding and Quantizing Neural 3D Scene
Representations [29.61554189447989]
本稿では,RGB-D画像からオブジェクトを検出し,その3Dポーズを推測するシステムを提案する。
多くの既存のシステムはオブジェクトを識別し、3Dのポーズを推測できるが、それらは人間のラベルや3Dアノテーションに大きく依存している。
論文 参考訳(メタデータ) (2020-10-30T13:56:09Z) - Canonical 3D Deformer Maps: Unifying parametric and non-parametric
methods for dense weakly-supervised category reconstruction [79.98689027127855]
独立オブジェクトの2次元画像の集合から学習できる共通オブジェクトカテゴリの3次元形状の表現を提案する。
提案手法は, パラメトリック変形モデル, 非パラメトリック3次元再構成, 標準埋め込みの概念に基づく新しい手法で構築する。
顔、車、鳥の野生のデータセットを3Dで再現することで、最先端の成果が得られます。
論文 参考訳(メタデータ) (2020-08-28T15:44:05Z) - Mask2CAD: 3D Shape Prediction by Learning to Segment and Retrieve [54.054575408582565]
本稿では,既存の3次元モデルの大規模データセットを活用し,画像中の物体の3次元構造を理解することを提案する。
本稿では,実世界の画像と検出対象を共同で検出するMask2CADについて,最も類似したCADモデルとそのポーズを最適化する。
これにより、画像内のオブジェクトのクリーンで軽量な表現が生成される。
論文 参考訳(メタデータ) (2020-07-26T00:08:37Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。