論文の概要: DCL-Net: Deep Correspondence Learning Network for 6D Pose Estimation
- arxiv url: http://arxiv.org/abs/2210.05232v1
- Date: Tue, 11 Oct 2022 08:04:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 16:12:26.727955
- Title: DCL-Net: Deep Correspondence Learning Network for 6D Pose Estimation
- Title(参考訳): DCL-Net:6次元空間推定のための深層対応学習ネットワーク
- Authors: Hongyang Li, Jiehong Lin and Kui Jia
- Abstract要約: 本稿では,DCL-Netとして短縮された直接6次元オブジェクトポーズ推定のためのディープ対応学習ネットワークを提案する。
DCL-Netは,YCB-Video,LineMOD,Oclussion-LineMODを含む3つのベンチマークデータセットにおいて,既存の手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 43.963630959349885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Establishment of point correspondence between camera and object coordinate
systems is a promising way to solve 6D object poses. However, surrogate
objectives of correspondence learning in 3D space are a step away from the true
ones of object pose estimation, making the learning suboptimal for the end
task. In this paper, we address this shortcoming by introducing a new method of
Deep Correspondence Learning Network for direct 6D object pose estimation,
shortened as DCL-Net. Specifically, DCL-Net employs dual newly proposed Feature
Disengagement and Alignment (FDA) modules to establish, in the feature space,
partial-to-partial correspondence and complete-to-complete one for partial
object observation and its complete CAD model, respectively, which result in
aggregated pose and match feature pairs from two coordinate systems; these two
FDA modules thus bring complementary advantages. The match feature pairs are
used to learn confidence scores for measuring the qualities of deep
correspondence, while the pose feature pairs are weighted by confidence scores
for direct object pose regression. A confidence-based pose refinement network
is also proposed to further improve pose precision in an iterative manner.
Extensive experiments show that DCL-Net outperforms existing methods on three
benchmarking datasets, including YCB-Video, LineMOD, and Oclussion-LineMOD;
ablation studies also confirm the efficacy of our novel designs.
- Abstract(参考訳): カメラと物体座標系間の点対応の確立は、6dオブジェクトのポーズを解決する有望な方法である。
しかし、3次元空間における対応学習の帰結的目的は、対象ポーズ推定の真の目標から一歩離れて、最終課題の学習を最適とする。
本稿では,dcl-netとして短縮された,直接6次元物体ポーズ推定のための深層対応学習ネットワークを提案する。
具体的には、dcl-netは、新たに提案された2つのフィーチャー・ディスベンジメント・アライメント(fda)モジュールを使用して、部分的なオブジェクトの観測と完全なcadモデルのために、部分から部分への対応と完全から完全までの対応を確立し、結果として2つの座標系から特徴対を集約し、これら2つのfdaモジュールは相補的な利点をもたらす。
一致特徴対は、深い対応性を測定するための信頼スコアを学習するために使用され、ポーズ特徴対は、直接対象ポーズ回帰のための信頼スコアによって重み付けされる。
また,ポーズ精度を反復的に向上するために,信頼度に基づくポーズ改善ネットワークを提案する。
大規模な実験により,YCB-Video,LineMOD,Oclussion-LineMODの3つのベンチマークデータセットにおいて,DCL-Netが既存の手法よりも優れていることが示された。
関連論文リスト
- IPoD: Implicit Field Learning with Point Diffusion for Generalizable 3D Object Reconstruction from Single RGB-D Images [50.4538089115248]
シングルビューRGB-D画像からの3Dオブジェクトの汎用化は依然として難しい課題である。
本稿では,暗黙の場学習と点拡散を調和させる新しい手法IPoDを提案する。
CO3D-v2データセットによる実験では、IPoDの優位性が確認され、Fスコアは7.8%、チャンファー距離は28.6%向上した。
論文 参考訳(メタデータ) (2024-03-30T07:17:37Z) - Q-REG: End-to-End Trainable Point Cloud Registration with Surface
Curvature [81.25511385257344]
本稿では、リッチな幾何学的情報を用いて、単一の対応から剛性ポーズを推定する新しい解Q-REGを提案する。
Q-REGは、堅牢な推定を徹底的な探索として形式化し、エンドツーエンドのトレーニングを可能にする。
実験では、Q-REGは対応マッチング法に非依存であり、推論とエンドツーエンドトレーニングの両方で使用した場合に一貫した改善を提供する。
論文 参考訳(メタデータ) (2023-09-27T20:58:53Z) - CheckerPose: Progressive Dense Keypoint Localization for Object Pose
Estimation with Graph Neural Network [66.24726878647543]
単一のRGB画像から固い物体の6-DoFのポーズを推定することは、非常に難しい課題である。
近年の研究では、高密度対応型解の大きな可能性を示している。
そこで本研究では,CheckerPoseというポーズ推定アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-29T17:30:53Z) - Category-Level 6D Object Pose and Size Estimation using Self-Supervised
Deep Prior Deformation Networks [39.6823489555449]
オブジェクトのインスタンスとそのセマンティクスを3D空間で正確にアノテートすることは困難であり、これらのタスクには合成データが広く使われている。
本研究では,Sim2Realのタスク設定において,カテゴリレベルの6Dオブジェクトのポーズとサイズ推定のための教師なしドメイン適応を実現することを目的としている。
本稿では,新しいCAMERA Deep Prior deformation Network(DPDN)上に構築した手法を提案する。
論文 参考訳(メタデータ) (2022-07-12T10:24:52Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - DFC: Deep Feature Consistency for Robust Point Cloud Registration [0.4724825031148411]
複雑なアライメントシーンのための学習に基づくアライメントネットワークを提案する。
我々は,3DMatchデータセットとKITTIオドメトリデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2021-11-15T08:27:21Z) - Learning Stereopsis from Geometric Synthesis for 6D Object Pose
Estimation [11.999630902627864]
現在のモノクラーベース6Dオブジェクトポーズ推定法は、一般的にRGBDベースの手法よりも競争力の低い結果が得られる。
本稿では,短いベースライン2ビュー設定による3次元幾何体積に基づくポーズ推定手法を提案する。
実験により,本手法は最先端の単分子法よりも優れ,異なる物体やシーンにおいて堅牢であることが示された。
論文 参考訳(メタデータ) (2021-09-25T02:55:05Z) - Learning 2D-3D Correspondences To Solve The Blind Perspective-n-Point
Problem [98.92148855291363]
本稿では、6-DoFの絶対カメラポーズ2D--3D対応を同時に解決するディープCNNモデルを提案する。
実データとシミュレーションデータの両方でテストした結果,本手法は既存手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-03-15T04:17:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。