論文の概要: SSP-Pose: Symmetry-Aware Shape Prior Deformation for Direct
Category-Level Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2208.06661v1
- Date: Sat, 13 Aug 2022 14:37:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-16 13:44:52.459918
- Title: SSP-Pose: Symmetry-Aware Shape Prior Deformation for Direct
Category-Level Object Pose Estimation
- Title(参考訳): ssp-pose:直接カテゴリーレベル物体ポーズ推定のための対称性を考慮した形状事前変形
- Authors: Ruida Zhang, Yan Di, Fabian Manhardt, Federico Tombari, Xiangyang Ji
- Abstract要約: カテゴリーレベルのポーズ推定は、クラス内形状の変化によって難しい問題である。
カテゴリレベルのポーズ推定のためのエンドツーエンドのトレーニング可能なネットワークSSP-Poseを提案する。
SSP-Poseは、リアルタイムの推論速度が約25Hzの競合に比べて性能が優れている。
- 参考スコア(独自算出の注目度): 77.88624073105768
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Category-level pose estimation is a challenging problem due to intra-class
shape variations. Recent methods deform pre-computed shape priors to map the
observed point cloud into the normalized object coordinate space and then
retrieve the pose via post-processing, i.e., Umeyama's Algorithm. The
shortcomings of this two-stage strategy lie in two aspects: 1) The surrogate
supervision on the intermediate results can not directly guide the learning of
pose, resulting in large pose error after post-processing. 2) The inference
speed is limited by the post-processing step. In this paper, to handle these
shortcomings, we propose an end-to-end trainable network SSP-Pose for
category-level pose estimation, which integrates shape priors into a direct
pose regression network. SSP-Pose stacks four individual branches on a shared
feature extractor, where two branches are designed to deform and match the
prior model with the observed instance, and the other two branches are applied
for directly regressing the totally 9 degrees-of-freedom pose and performing
symmetry reconstruction and point-wise inlier mask prediction respectively.
Consistency loss terms are then naturally exploited to align the outputs of
different branches and promote the performance. During inference, only the
direct pose regression branch is needed. In this manner, SSP-Pose not only
learns category-level pose-sensitive characteristics to boost performance but
also keeps a real-time inference speed. Moreover, we utilize the symmetry
information of each category to guide the shape prior deformation, and propose
a novel symmetry-aware loss to mitigate the matching ambiguity. Extensive
experiments on public datasets demonstrate that SSP-Pose produces superior
performance compared with competitors with a real-time inference speed at about
25Hz.
- Abstract(参考訳): カテゴリーレベルのポーズ推定はクラス内の形状変化のために難しい問題である。
近年の手法では、観測された点雲を正規化された物体座標空間にマッピングし、後処理、すなわち梅山アルゴリズムを用いてポーズを復元する。
この二段階戦略の欠点は2つの側面にある。
1) 中間結果の代理監督は, ポーズの学習を直接指導することはできないため, 後処理後のポーズエラーが大きい。
2) 推論速度は後処理ステップによって制限される。
本稿では、これらの欠点に対処するため、カテゴリレベルのポーズ推定のためのエンドツーエンドのトレーニング可能なネットワークSSP-Poseを提案する。
SSP-Poseは、4つの分枝を共有特徴抽出器に積み重ね、この2つの分枝は前モデルと観測例とを変形・整合するように設計され、残りの2つの分枝は、全9自由度ポーズを直接回帰させ、それぞれ対称性再構成と点次不整合マスク予測を行う。
一貫性損失項は自然に利用され、異なるブランチの出力を整列させ、パフォーマンスを促進する。
推論中は、直接ポーズ回帰ブランチのみが必要である。
このように、SSP-Poseはカテゴリレベルのポーズ感性特性を学習し、性能を向上するだけでなく、リアルタイムの推論速度も維持する。
さらに,各カテゴリの対称性情報を用いて,変形前の形状を案内し,マッチングのあいまいさを軽減するための新しい対称性認識損失を提案する。
公開データセットに対する大規模な実験により、SSP-Poseは、リアルタイムの推論速度が約25Hzの競合と比較して、優れた性能を発揮することが示された。
関連論文リスト
- Towards Cross-View-Consistent Self-Supervised Surround Depth Estimation [9.569646683579899]
連続画像からの自己監督下周深度推定は経済的な代替手段を提供する。
従来のSSSDE法では、画像間で情報を融合する異なるメカニズムが提案されているが、それらのいくつかは、クロスビュー制約を明示的に考慮している。
本稿では,SSSDEのクロスビュー一貫性を高めるために,効率的で一貫したポーズ推定設計と2つの損失関数を提案する。
論文 参考訳(メタデータ) (2024-07-04T16:29:05Z) - DR-Pose: A Two-stage Deformation-and-Registration Pipeline for
Category-level 6D Object Pose Estimation [9.074911955402495]
カテゴリーレベルのオブジェクトポーズ推定では、所定のカテゴリからオブジェクトの6Dポーズと3Dメトリックサイズを推定する。
近年のアプローチでは、ポーズ推定精度を向上させるために、カテゴリ形状の事前情報を参考にしている。
本稿では, DR-Poseと呼ばれる2段階の変形・登録パイプラインを提案する。
論文 参考訳(メタデータ) (2023-09-05T03:24:09Z) - IMP: Iterative Matching and Pose Estimation with Adaptive Pooling [34.36397639248686]
我々はEIMPと呼ばれるテキストbfefficient IMPを提案し、潜在的に一致しないキーポイントを動的に破棄する。
YFCC100m、Scannet、Aachen Day-Nightのデータセットに対する実験により、提案手法は精度と効率の点で従来の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-04-28T13:25:50Z) - Generalizing Neural Human Fitting to Unseen Poses With Articulated SE(3)
Equivariance [48.39751410262664]
ArtEqは、点雲からのSMPLモデル推定のための部分ベースSE(3)等価ニューラルネットワークである。
実験の結果,ArtEqはトレーニング中に見えない動作を一般化し,身体再建精度の点で最先端の手法を44%上回った。
論文 参考訳(メタデータ) (2023-04-20T17:58:26Z) - RBP-Pose: Residual Bounding Box Projection for Category-Level Pose
Estimation [103.74918834553247]
カテゴリーレベルのオブジェクトポーズ推定は、既知のカテゴリの集合からの任意のオブジェクトの3次元メートル法サイズだけでなく、6次元のポーズを予測することを目的としている。
近年の手法では, 観測された点雲を標準空間にマッピングし, 梅山アルゴリズムを用いてポーズとサイズを復元する手法が提案されている。
本稿では,オブジェクトのポーズと残差ベクトルを共同で予測する,幾何学誘導型残差オブジェクト境界ボックス投影ネットワーク RBP-Pose を提案する。
論文 参考訳(メタデータ) (2022-07-30T14:45:20Z) - CATRE: Iterative Point Clouds Alignment for Category-level Object Pose
Refinement [52.41884119329864]
カテゴリーレベルのオブジェクトポーズとサイズ精細化器 CATRE は、点雲からのポーズ推定を反復的に強化し、正確な結果が得られる。
提案手法は,REAL275,CAMERA25,LMのベンチマークを85.32Hzまで高速化する。
論文 参考訳(メタデータ) (2022-07-17T05:55:00Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。