論文の概要: 6D Rotation Representation For Unconstrained Head Pose Estimation
- arxiv url: http://arxiv.org/abs/2202.12555v1
- Date: Fri, 25 Feb 2022 08:41:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-28 21:11:32.533456
- Title: 6D Rotation Representation For Unconstrained Head Pose Estimation
- Title(参考訳): 無拘束頭部ポーズ推定のための6次元回転表現
- Authors: Thorsten Hempel and Ahmed A. Abdelrahman and Ayoub Al-Hamadi
- Abstract要約: 本研究は, 基底真理データに対する回転行列形式を導入して, あいまいな回転ラベルの問題に対処する。
このようにして、提案手法は、ポーズ予測を狭角に制限する従来のアプローチとは正反対に、全回転の外観を学習することができる。
AFLW2000およびBIWIデータセットを用いた実験により,提案手法が他の最先端手法よりも最大20%高い性能を示した。
- 参考スコア(独自算出の注目度): 2.1485350418225244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a method for unconstrained end-to-end head pose
estimation. We address the problem of ambiguous rotation labels by introducing
the rotation matrix formalism for our ground truth data and propose a
continuous 6D rotation matrix representation for efficient and robust direct
regression. This way, our method can learn the full rotation appearance which
is contrary to previous approaches that restrict the pose prediction to a
narrow-angle for satisfactory results. In addition, we propose a geodesic
distance-based loss to penalize our network with respect to the SO(3) manifold
geometry. Experiments on the public AFLW2000 and BIWI datasets demonstrate that
our proposed method significantly outperforms other state-of-the-art methods by
up to 20\%. We open-source our training and testing code along with our
pre-trained models: https://github.com/thohemp/6DRepNet.
- Abstract(参考訳): 本稿では,制約のないエンドツーエンドの頭部ポーズ推定手法を提案する。
そこで本研究では,本研究の真理データに対する回転行列形式を導入し,効率的かつロバストな直接回帰のための連続6次元回転行列表現を提案する。
この方法では, 姿勢予測を狭角に制限し, 良好な結果を得るという従来のアプローチとは対照的に, 完全な回転の出現を学習できる。
さらに,SO(3)多様体の幾何に関して,我々のネットワークをペナルティ化する測地線距離に基づく損失を提案する。
aflw2000とbiwiデータセットの公開実験により,提案手法は他の最先端手法よりも最大20\%高い性能を示した。
トレーニングとテストのコードを、トレーニング済みのモデルとともにオープンソースにしています。
関連論文リスト
- RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - Towards Robust and Unconstrained Full Range of Rotation Head Pose
Estimation [2.915868985330569]
本稿では,非拘束型終端頭部ポーズ推定のための新しい手法を提案する。
効率的かつロバストな直接回帰のための連続6次元回転行列表現を提案する。
提案手法は,他の最先端手法よりも効率的かつロバストに優れる。
論文 参考訳(メタデータ) (2023-09-14T12:17:38Z) - D3L: Decomposition of 3D Rotation and Lift from 2D Joint to 3D for Human
Mesh Recovery [0.6638820451554986]
我々は2次元関節から3次元メッシュ(D3L)への3次元回転とリフトの分解という新しいアプローチを提案する。
我々は3次元関節回転を骨方向と骨ねじれ方向に切り離して、人間のメッシュ回復タスクを、ポーズ、ツイスト、形状の推定に分解する。
提案手法は,人間のポーズ推定手法を活用でき,形状推定過適合によるポーズ誤差を回避することができる。
論文 参考訳(メタデータ) (2023-06-10T10:41:54Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D
Object Pose Estimation [71.83992173720311]
単一のRGB画像からの6次元ポーズ推定はコンピュータビジョンの基本課題である。
GDR-Net(Geometry-Guided Direct Regression Network)を用いて6Dポーズをエンドツーエンドで学習する。
提案手法は, LM, LM-O, YCB-Vデータセットの最先端手法よりも優れている。
論文 参考訳(メタデータ) (2021-02-24T09:11:31Z) - Nonlinear Dimensionality Reduction for Data Visualization: An
Unsupervised Fuzzy Rule-based Approach [5.5612170847190665]
本稿では,主にデータ可視化のための教師なしファジィ規則に基づく次元削減手法を提案する。
入力データ中のクラスタを用いて,一階の高木-菅野型モデルを用いてルール前駆体を生成する。
提案手法を3つの実世界のデータセットと3つの実世界のデータセットに適用し、その結果を他の4つの標準データ可視化手法と視覚的に比較する。
論文 参考訳(メタデータ) (2020-04-08T10:33:06Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z) - Learning Nonparametric Human Mesh Reconstruction from a Single Image
without Ground Truth Meshes [56.27436157101251]
そこで本研究では,人間のメッシュ再構築を基礎となる真理メッシュを使わずに学習する手法を提案する。
これはグラフ畳み込みニューラルネットワーク(Graph CNN)の損失関数に2つの新しい用語を導入することで実現される。
論文 参考訳(メタデータ) (2020-02-28T20:30:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。