論文の概要: Vote from the Center: 6 DoF Pose Estimation in RGB-D Images by Radial
Keypoint Voting
- arxiv url: http://arxiv.org/abs/2104.02527v1
- Date: Tue, 6 Apr 2021 14:06:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 14:03:58.417323
- Title: Vote from the Center: 6 DoF Pose Estimation in RGB-D Images by Radial
Keypoint Voting
- Title(参考訳): センターからの投票:ラジアルキーポイント投票によるrgb-d画像のdofポーズ推定
- Authors: Yangzheng Wu, Mohsen Zand, Ali Etemad, Michael Greenspan
- Abstract要約: 本稿では,既存のスキームよりも精度が高く,分散キーポイントのより小さな集合を可能にする,交差球面に基づく新しいキーポイント投票方式を提案する。
提案手法は,RGB-Dデータ中の3次元オブジェクトの6次元ポーズ推定のためのRCVPose法の基礎となる。
- 参考スコア(独自算出の注目度): 7.6997148655751895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel keypoint voting scheme based on intersecting spheres, that
is more accurate than existing schemes and allows for a smaller set of more
disperse keypoints. The scheme forms the basis of the proposed RCVPose method
for 6 DoF pose estimation of 3D objects in RGB-D data, which is particularly
effective at handling occlusions. A CNN is trained to estimate the distance
between the 3D point corresponding to the depth mode of each RGB pixel, and a
set of 3 disperse keypoints defined in the object frame. At inference, a sphere
of radius equal to this estimated distance is generated, centered at each 3D
point. The surface of these spheres votes to increment a 3D accumulator space,
the peaks of which indicate keypoint locations. The proposed radial voting
scheme is more accurate than previous vector or offset schemes, and robust to
disperse keypoints. Experiments demonstrate RCVPose to be highly accurate and
competitive, achieving state-of-the-art results on LINEMOD 99.7%, YCB-Video
97.2% datasets, and notably scoring +7.9% higher than previous methods on the
challenging Occlusion LINEMOD 71.1% dataset.
- Abstract(参考訳): 本稿では,既存のスキームよりも精度が高く,分散キーポイントのより小さな集合を可能にする,交差球面に基づく新しいキーポイント投票方式を提案する。
rgb-dデータ中の3dオブジェクトの6自由度位置推定のためのrcvpose法の基礎となり,特に咬合の取り扱いに有効である。
cnnは、各rgb画素の深さモードに対応する3d点と、オブジェクトフレームで定義された3つの分散キーポイントとの距離を推定するように訓練される。
推測では、この推定距離に等しい半径の球が、各3D点を中心に生成される。
これらの球面の表面は、キーポイント位置を示す3Dアキュムレータ空間の増分に投票する。
提案したラジアル投票方式は,従来のベクトルやオフセット方式よりも精度が高く,キーポイントの分散が困難である。
実験では、RCVPoseは非常に正確で競争力があり、LINEMOD 99.7%、YCB-Video 97.2%のデータセットで最先端の結果が得られた。
関連論文リスト
- 3D Object Detection from Point Cloud via Voting Step Diffusion [52.9966883689137]
既存の投票ベースのメソッドは、個々のオブジェクトの部分的な面から厳しいノイズとともに投票を受け取り、亜最適検出性能をもたらす。
雑音条件付きスコアネットワークを用いて分布のスコア関数を推定することにより、ランダムな3Dポイントを分布の高密度領域へ移動させる新しい手法を提案する。
大規模屋内3DシーンデータセットSUN RGB-DとScanNet V2の実験により,提案手法の優位性を実証した。
論文 参考訳(メタデータ) (2024-03-21T05:04:52Z) - Learning Better Keypoints for Multi-Object 6DoF Pose Estimation [1.0878040851638]
グラフネットワークをトレーニングして、同様に分散された投票で分散されたキーポイントのセットを選択する。
これらの投票は、キーポイントの位置の証拠を蓄積するために回帰ネットワークによって学習され、より正確に回帰することができる。
実験では、KeyGNetが選択したキーポイントが、テストされた7つのデータセットのすべての評価指標の精度を改善した。
論文 参考訳(メタデータ) (2023-08-15T15:11:13Z) - Keypoint Cascade Voting for Point Cloud Based 6DoF Pose Estimation [1.3439502310822147]
本稿では,RGB情報のない入力として純無秩序のクラウド幾何を用いる6DoFオブジェクトポーズ推定法を提案する。
提案手法であるRCVPose3Dは,キーポイント回帰とセマンティックセグメンテーションのタスクを分離した新しいアーキテクチャに基づいている。
論文 参考訳(メタデータ) (2022-10-14T21:36:52Z) - Neural Correspondence Field for Object Pose Estimation [67.96767010122633]
1枚のRGB画像から3次元モデルで剛体物体の6DoFポーズを推定する手法を提案する。
入力画像の画素で3次元オブジェクト座標を予測する古典的対応法とは異なり,提案手法はカメラフラストラムでサンプリングされた3次元クエリポイントで3次元オブジェクト座標を予測する。
論文 参考訳(メタデータ) (2022-07-30T01:48:23Z) - VPFNet: Improving 3D Object Detection with Virtual Point based LiDAR and
Stereo Data Fusion [62.24001258298076]
VPFNetは、ポイントクラウドとイメージデータを仮想のポイントで巧みに調整し集約する新しいアーキテクチャである。
当社のVPFNetは,KITTIテストセットで83.21%の中等度3D AP,91.86%中等度BEV APを達成し,2021年5月21日以来の1位となった。
論文 参考訳(メタデータ) (2021-11-29T08:51:20Z) - KDFNet: Learning Keypoint Distance Field for 6D Object Pose Estimation [43.839322860501596]
KDFNetはRGB画像から6次元オブジェクトのポーズ推定を行う新しい手法である。
投影された2次元キーポイント位置に対するキーポイント距離場(KDF)と呼ばれる連続表現を提案する。
我々は、キーポイント毎にKDFを回帰するために、完全に畳み込みニューラルネットワークを使用します。
論文 参考訳(メタデータ) (2021-09-21T12:17:24Z) - SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation [98.83762558394345]
SO-Poseは、オブジェクトの6自由度(6DoF)をすべて、単一のRGBイメージから散らばった環境でポーズさせるフレームワークである。
本稿では,3次元オブジェクトの2層表現を確立するために,自己閉塞に関する新たな推論を導入する。
対応性,自己閉塞性,6次元ポーズを整列する層間合成により,精度とロバスト性をさらに向上させることができる。
論文 参考訳(メタデータ) (2021-08-18T19:49:29Z) - 3D Point-to-Keypoint Voting Network for 6D Pose Estimation [8.801404171357916]
3次元キーポイントの空間構造特性に基づくRGB-Dデータから6次元ポーズ推定のためのフレームワークを提案する。
提案手法は, LINEMOD と OCCLUSION LINEMOD の2つのベンチマークデータセットで検証する。
論文 参考訳(メタデータ) (2020-12-22T11:43:15Z) - EPOS: Estimating 6D Pose of Objects with Symmetries [57.448933686429825]
1つのRGB入力から利用可能な3次元モデルを用いて、剛体物体の6次元ポーズを推定する新しい手法を提案する。
オブジェクトは、体系的な方法で対称性を許容するコンパクトな表面フラグメントによって表現される。
エンコーダデコーダネットワークを用いて,高密度サンプリング画素とフラグメントの対応性を予測する。
論文 参考訳(メタデータ) (2020-04-01T17:41:08Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。