論文の概要: MPF6D: Masked Pyramid Fusion 6D Pose Estimation
- arxiv url: http://arxiv.org/abs/2111.09378v1
- Date: Wed, 17 Nov 2021 20:23:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-19 13:56:31.379461
- Title: MPF6D: Masked Pyramid Fusion 6D Pose Estimation
- Title(参考訳): MPF6D:マズードピラミッド核融合6Dポス推定
- Authors: Nuno Pereira and Lu\'is A. Alexandre
- Abstract要約: 提案手法では,提案手法の精度を向上させるため,物体の6次元ポーズを推定する手法を提案する。
提案手法は, 推定時間0.12秒でリアルタイムに利用でき, 精度が高い。
- 参考スコア(独自算出の注目度): 1.2891210250935146
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object pose estimation has multiple important applications, such as robotic
grasping and augmented reality. We present a new method to estimate the 6D pose
of objects that improves upon the accuracy of current proposals and can still
be used in real-time. Our method uses RGB-D data as input to segment objects
and estimate their pose. It uses a neural network with multiple heads, one head
estimates the object classification and generates the mask, the second
estimates the values of the translation vector and the last head estimates the
values of the quaternion that represents the rotation of the object. These
heads leverage a pyramid architecture used during feature extraction and
feature fusion. Our method can be used in real-time with its low inference time
of 0.12 seconds and has high accuracy. With this combination of fast inference
and good accuracy it is possible to use our method in robotic pick and place
tasks and/or augmented reality applications.
- Abstract(参考訳): オブジェクトのポーズ推定には、ロボットの把握や拡張現実など、複数の重要な応用がある。
本稿では,現在の提案の精度を向上し,なおかつリアルタイムに使用できる物体の6次元形状を推定する新しい手法を提案する。
提案手法では,RGB-Dデータを入力として,オブジェクトを分割し,ポーズを推定する。
複数のヘッドを持つニューラルネットワークを使用し、1つのヘッドはオブジェクトの分類を推定し、マスクを生成し、2番目のヘッドは翻訳ベクトルの値を推定し、最後のヘッドはオブジェクトの回転を表す四元数の値を推定する。
これらのヘッドは、特徴抽出と特徴融合に使用されるピラミッドアーキテクチャを利用する。
提案手法は0.12秒の推論時間と高精度でリアルタイムに使用できる。
この高速推論と精度の良さを組み合わせることで、ロボットのピック&プレイスタスクや拡張現実アプリケーションでこの手法を使うことができる。
関連論文リスト
- ZS6D: Zero-shot 6D Object Pose Estimation using Vision Transformers [9.899633398596672]
ゼロショット新規オブジェクト6Dのポーズ推定にZS6Dを導入する。
事前訓練された視覚変換器(ViT)を用いて抽出された視覚ディスクリプタは、レンダリングテンプレートのマッチングに使用される。
LMO、YCBV、TLESSデータセットで実験が行われる。
論文 参考訳(メタデータ) (2023-09-21T11:53:01Z) - LocPoseNet: Robust Location Prior for Unseen Object Pose Estimation [69.70498875887611]
LocPoseNetは、見えないオブジェクトに先立って、ロバストにロケーションを学習することができる。
提案手法は,LINEMOD と GenMOP において,既存の作業よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-29T15:21:34Z) - CRT-6D: Fast 6D Object Pose Estimation with Cascaded Refinement
Transformers [51.142988196855484]
本稿では,CRT-6D(Cascaded Refinement Transformers)と呼ぶ新しい手法を提案する。
一般的に使用される高密度中間表現を,Os(Object Keypoint Features)と呼ばれる機能ピラミッドからサンプリングされた,各要素がオブジェクトキーポイントに対応するスパースな機能セットに置き換える。
一つのモデル上で最大21個のオブジェクトをサポートしながら,最も近いリアルタイム状態よりも2倍高速な推論を実現する。
論文 参考訳(メタデータ) (2022-10-21T04:06:52Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - 6D Object Pose Estimation using Keypoints and Part Affinity Fields [24.126513851779936]
RGB画像からの6Dオブジェクトのポーズ推定のタスクは、自律型サービスロボットが現実世界と対話できるための重要な要件である。
既知物体の6自由度変換と配向を推定するための2段階パイプラインを提案する。
論文 参考訳(メタデータ) (2021-07-05T14:41:19Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - EfficientPose: An efficient, accurate and scalable end-to-end 6D multi
object pose estimation approach [0.0]
6次元オブジェクトのポーズ推定のための新しいアプローチであるEfficientPoseを紹介する。
非常に正確で、効率的で、幅広い計算資源に対してスケーラブルである。
複数のオブジェクトやインスタンスの2Dバウンディングボックスを検出したり、ひとつのショットで完全な6Dポーズを推定することができる。
論文 参考訳(メタデータ) (2020-11-09T10:23:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。