Fugu-MT 論文翻訳(概要): Cov2Pose: Leveraging Spatial Covariance for Direct Manifold-aware 6-DoF Object Pose Estimation

論文の概要: Cov2Pose: Leveraging Spatial Covariance for Direct Manifold-aware 6-DoF Object Pose Estimation

arxiv url: http://arxiv.org/abs/2603.19961v2
Date: Thu, 26 Mar 2026 10:42:28 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-27 13:32:29.789319
Title: Cov2Pose: Leveraging Spatial Covariance for Direct Manifold-aware 6-DoF Object Pose Estimation
Title（参考訳）: Cov2Pose:直接マニフォールド対応6-DoFオブジェクトポース推定のための空間共分散の活用
Authors: Nassim Ali Ousalah, Peyman Rostami, Vincent Gaudillière, Emmanuel Koumandakis, Anis Kacem, Enjie Ghorbel, Djamila Aouada,
Abstract要約: 単一のRGB画像から6-DoFオブジェクトのポーズ推定の問題に対処する。通常、中間2次元キーポイントを予測し、パースペクティブ-n-Pointソルバに続く間接的手法は、優れた性能を示している。ポーズをエンドツーエンドで回帰する直接的なアプローチは、通常より計算効率が良いが精度は低い。
参考スコア（独自算出の注目度）: 20.076787884512136
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we address the problem of 6-DoF object pose estimation from a single RGB image. Indirect methods that typically predict intermediate 2D keypoints, followed by a Perspective-n-Point solver, have shown great performance. Direct approaches, which regress the pose in an end-to-end manner, are usually computationally more efficient but less accurate. However, direct pose regression heads rely on globally pooled features, ignoring spatial second-order statistics despite their informativeness in pose prediction. They also predict, in most cases, discontinuous pose representations that lack robustness. Herein, we therefore propose a covariance-pooled representation that encodes convolutional feature distributions as a symmetric positive definite (SPD) matrix. Moreover, we propose a novel pose encoding in the form of an SPD matrix via its Cholesky decomposition. Pose is then regressed in an end-to-end manner with a manifold-aware network head, taking into account the Riemannian geometry of SPD matrices. Experiments and ablations consistently demonstrate the relevance of second-order pooling and continuous representations for direct pose regression, including under partial occlusion.
Abstract（参考訳）: 本稿では,1枚のRGB画像から6-DoFオブジェクトのポーズ推定の問題に対処する。通常、中間2次元キーポイントを予測し、パースペクティブ-n-Pointソルバに続く間接的手法は、優れた性能を示している。ポーズをエンドツーエンドで回帰する直接アプローチは、通常より計算効率が良いが精度は低い。しかし、直接ポーズ回帰ヘッドは、ポーズ予測における情報性にも拘わらず、空間的な2階統計を無視し、グローバルにプールされた特徴に依存している。彼らはまた、多くの場合、堅牢性に欠ける不連続なポーズ表現を予測します。そこで本研究では、畳み込み特徴分布を対称正定値行列(SPD)として符号化する共分散プール表現を提案する。さらに,チョレスキー分解によるSPD行列の形での新規なポーズ符号化を提案する。ポースは、SPD行列のリーマン幾何学を考慮して、多様体対応のネットワークヘッドでエンドツーエンドに回帰される。実験とアブレーションは、部分閉塞を含む直接ポーズ回帰に対する二階プーリングと連続表現の関連性を一貫して示している。

関連論文リスト

Corr2Distrib: Making Ambiguous Correspondences an Ally to Predict Reliable 6D Pose Distributions [16.706945699819308]
Corr2DistribはRGB画像から6Dカメラのポーズ分布を推定する最初の対応方式である。 Corr2Distribは、RGB画像からのポーズ分布推定とシングルポーズ推定の両方において、最先端のソリューションよりも優れていることを示す。
論文参考訳（メタデータ） (2025-05-05T09:29:32Z)
Occlusion Handling in 3D Human Pose Estimation with Perturbed Positional Encoding [15.834419910916933]
固有基底から一貫した正規成分を抽出する新しい位置符号化手法PerturbPEを提案する。実験結果では,Human3.6Mデータセットで最大12%のパフォーマンス向上が観測された。我々の新しいアプローチは、2つのエッジが欠落しているシナリオのパフォーマンスを大幅に向上させ、最先端のベンチマークを新たに設定する。
論文参考訳（メタデータ） (2024-05-27T17:48:54Z)
DVMNet++: Rethinking Relative Pose Estimation for Unseen Objects [59.51874686414509]
既存のアプローチでは、通常、接地構造オブジェクト境界ボックスと、多数の離散仮説を持つ近似3次元回転を用いて3次元翻訳を予測している。本稿では,1回のパスで相対オブジェクトのポーズを計算するDeep Voxel Matching Network (DVMNet++)を提案する。提案手法は,最先端手法と比較して計算コストの低い新しいオブジェクトに対して,より正確な相対的ポーズ推定を行う。
論文参考訳（メタデータ） (2024-03-20T15:41:32Z)
Linear-Covariance Loss for End-to-End Learning of 6D Pose Estimation [64.12149365530624]
現代の画像に基づく6Dオブジェクトのポーズ推定手法は、2D-3D対応の予測を学習し、そこから解法を用いてポーズを求めることができる。ここでは、ネットワークが精度を低下させるであろう勾配につながる問題の平均的な性質と矛盾するものであると論じる。
論文参考訳（メタデータ） (2023-03-21T00:32:31Z)
SSP-Pose: Symmetry-Aware Shape Prior Deformation for Direct Category-Level Object Pose Estimation [77.88624073105768]
カテゴリーレベルのポーズ推定は、クラス内形状の変化によって難しい問題である。カテゴリレベルのポーズ推定のためのエンドツーエンドのトレーニング可能なネットワークSSP-Poseを提案する。 SSP-Poseは、リアルタイムの推論速度が約25Hzの競合に比べて性能が優れている。
論文参考訳（メタデータ） (2022-08-13T14:37:31Z)
Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文参考訳（メタデータ） (2022-03-29T07:14:58Z)
RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文参考訳（メタデータ） (2022-03-24T06:24:55Z)
Collaborative Representation for SPD Matrices with Application to Image-Set Classification [12.447073442122468]
協調表現に基づく分類(CRC)はここ数年で顕著な進歩を遂げている。既存のCRC法では非線形変動情報を直接処理することができない。最近の進歩は、これらの非線形変動情報を効果的にモデル化し、不変表現を学習する方法がオープンな課題であることを示している。
論文参考訳（メタデータ） (2022-01-22T04:56:53Z)
Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文参考訳（メタデータ） (2022-01-19T04:31:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。