論文の概要: Spatial Feature Mapping for 6DoF Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2206.01831v1
- Date: Fri, 3 Jun 2022 21:44:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-07 16:25:51.073058
- Title: Spatial Feature Mapping for 6DoF Object Pose Estimation
- Title(参考訳): 6次元物体ポーズ推定のための空間特徴マッピング
- Authors: Jianhan Mei, Xudong Jiang, Henghui Ding
- Abstract要約: この研究は、6Dof (6D)オブジェクトのポーズを背景クラッタで推定することを目的としている。
本稿では,強い閉塞と背景雑音を考慮し,この課題に対処するために空間構造を活用することを提案する。
- 参考スコア(独自算出の注目度): 29.929911622127502
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work aims to estimate 6Dof (6D) object pose in background clutter.
Considering the strong occlusion and background noise, we propose to utilize
the spatial structure for better tackling this challenging task. Observing that
the 3D mesh can be naturally abstracted by a graph, we build the graph using 3D
points as vertices and mesh connections as edges. We construct the
corresponding mapping from 2D image features to 3D points for filling the graph
and fusion of the 2D and 3D features. Afterward, a Graph Convolutional Network
(GCN) is applied to help the feature exchange among objects' points in 3D
space. To address the problem of rotation symmetry ambiguity for objects, a
spherical convolution is utilized and the spherical features are combined with
the convolutional features that are mapped to the graph. Predefined 3D
keypoints are voted and the 6DoF pose is obtained via the fitting optimization.
Two scenarios of inference, one with the depth information and the other
without it are discussed. Tested on the datasets of YCB-Video and LINEMOD, the
experiments demonstrate the effectiveness of our proposed method.
- Abstract(参考訳): この研究は、6Dof (6D)オブジェクトのポーズを背景クラッタで推定することを目的としている。
強い咬合と背景雑音を考慮し,この課題に取り組むために空間構造を活用することを提案する。
グラフによって自然に3dメッシュを抽象化できることを観察し、3dポイントを頂点とし、メッシュ接続をエッジとしてグラフを構築します。
2次元画像特徴から3次元点への対応マッピングを構築し,2次元特徴と3次元特徴の融合処理を行う。
その後、グラフ畳み込みネットワーク(gcn)を適用し、3次元空間におけるオブジェクトの点間の特徴交換を支援する。
物体の回転対称性の曖昧性の問題に対処するために、球面畳み込みを利用して、球面の特徴とグラフにマッピングされた畳み込み特徴とを組み合わせる。
予め定義された3Dキーポイントが投票され、フィッティング最適化により6DoFポーズが得られる。
深度情報を持つ2つの推論シナリオとそれを持たない2つのシナリオについて論じる。
YCB-VideoとLINEMODのデータセットを用いて実験を行い,提案手法の有効性を実証した。
関連論文リスト
- Neural Correspondence Field for Object Pose Estimation [67.96767010122633]
1枚のRGB画像から3次元モデルで剛体物体の6DoFポーズを推定する手法を提案する。
入力画像の画素で3次元オブジェクト座標を予測する古典的対応法とは異なり,提案手法はカメラフラストラムでサンプリングされた3次元クエリポイントで3次元オブジェクト座標を予測する。
論文 参考訳(メタデータ) (2022-07-30T01:48:23Z) - Weakly Supervised Learning of Keypoints for 6D Object Pose Estimation [73.40404343241782]
2次元キーポイント検出に基づく弱教師付き6次元オブジェクトポーズ推定手法を提案する。
提案手法は,最先端の完全教師付きアプローチと同等の性能を実現する。
論文 参考訳(メタデータ) (2022-03-07T16:23:47Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR-based
Perception [122.53774221136193]
運転時のLiDARに基づく認識のための最先端の手法は、しばしば点雲を2D空間に投影し、2D畳み込みによって処理する。
自然な対策として、3Dボクセル化と3D畳み込みネットワークを利用する方法がある。
本研究では,3次元幾何学的パターンを探索するために,円筒状分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-12T06:25:11Z) - Joint Deep Multi-Graph Matching and 3D Geometry Learning from
Inhomogeneous 2D Image Collections [57.60094385551773]
非均質な画像コレクションから変形可能な3Dジオメトリモデルを学ぶためのトレーニング可能なフレームワークを提案する。
さらに,2次元画像で表現された物体の3次元形状も取得する。
論文 参考訳(メタデータ) (2021-03-31T17:25:36Z) - 3D Point-to-Keypoint Voting Network for 6D Pose Estimation [8.801404171357916]
3次元キーポイントの空間構造特性に基づくRGB-Dデータから6次元ポーズ推定のためのフレームワークを提案する。
提案手法は, LINEMOD と OCCLUSION LINEMOD の2つのベンチマークデータセットで検証する。
論文 参考訳(メタデータ) (2020-12-22T11:43:15Z) - Cylinder3D: An Effective 3D Framework for Driving-scene LiDAR Semantic
Segmentation [87.54570024320354]
大規模運転シーンのLiDARセマンティックセマンティックセグメンテーションのための最先端の手法は、しばしば2D空間の点雲を投影して処理する。
3D-to-2Dプロジェクションの問題に取り組むための簡単な解決策は、3D表現を保ち、3D空間の点を処理することである。
我々は3次元シリンダー分割と3次元シリンダー畳み込みに基づくフレームワークをCylinder3Dとして開発し,3次元トポロジの関係と運転シーンの点雲の構造を利用する。
論文 参考訳(メタデータ) (2020-08-04T13:56:19Z) - KAPLAN: A 3D Point Descriptor for Shape Completion [80.15764700137383]
KAPLANは、一連の2D畳み込みを通じて局所的な形状情報を集約する3Dポイント記述子である。
各平面において、正規点や平面間距離のような点特性は2次元グリッドに集約され、効率的な2次元畳み込みエンコーダを持つ特徴表現に抽象化される。
公開データセットの実験では、KAPLANが3D形状の完成のために最先端のパフォーマンスを達成することが示されている。
論文 参考訳(メタデータ) (2020-07-31T21:56:08Z) - 3D Shape Segmentation with Geometric Deep Learning [2.512827436728378]
本稿では,部分分割問題としてセグメント化全体を解くために,3次元形状の3次元拡張ビューを生成するニューラルネットワークベースのアプローチを提案する。
提案手法は,公開データセットの3次元形状と,フォトグラム法を用いて再構成した実物体を用いて検証する。
論文 参考訳(メタデータ) (2020-02-02T14:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。