論文の概要: Full-range Head Pose Geometric Data Augmentations
- arxiv url: http://arxiv.org/abs/2408.01566v1
- Date: Fri, 2 Aug 2024 20:41:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-06 19:30:18.836518
- Title: Full-range Head Pose Geometric Data Augmentations
- Title(参考訳): フルレンジヘッドポース幾何データ拡張
- Authors: Huei-Chung Hu, Xuyang Wu, Haowei Liu, Ting-Ruen Wei, Hsin-Tai Wu,
- Abstract要約: 多くのヘッドポーズ推定(HPE)メソッドは、フルレンジデータセットを作成する能力を約束する。
これらの手法は、頭部角度の範囲内でのみ正確であり、この特定の範囲を超えると、重大な不正確な結果がもたらされる。
本稿では,正しい軸列の座標系とオイラー角を正確に推定する手法を提案する。
- 参考スコア(独自算出の注目度): 2.8358100463599722
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many head pose estimation (HPE) methods promise the ability to create full-range datasets, theoretically allowing the estimation of the rotation and positioning of the head from various angles. However, these methods are only accurate within a range of head angles; exceeding this specific range led to significant inaccuracies. This is dominantly explained by unclear specificity of the coordinate systems and Euler Angles used in the foundational rotation matrix calculations. Here, we addressed these limitations by presenting (1) methods that accurately infer the correct coordinate system and Euler angles in the correct axis-sequence, (2) novel formulae for 2D geometric augmentations of the rotation matrices under the (SPECIFIC) coordinate system, (3) derivations for the correct drawing routines for rotation matrices and poses, and (4) mathematical experimentation and verification that allow proper pitch-yaw coverage for full-range head pose dataset generation. Performing our augmentation techniques to existing head pose estimation methods demonstrated a significant improvement to the model performance. Code will be released upon paper acceptance.
- Abstract(参考訳): 多くのヘッドポーズ推定(HPE)手法は、理論上、様々な角度から頭部の回転と位置を推定できるフルレンジデータセットを作成することを約束する。
しかし、これらの手法は頭部角度の範囲内でのみ正確であり、この特定の範囲を超えると重大な不正確な結果がもたらされる。
これは、座標系と基底回転行列計算で用いられるオイラー角の明確な特異性によって、支配的に説明される。
そこで我々は,(1)正しい座標系とユーラー角を正しい軸列で正確に推定する手法,(2)SPECIFIC座標系の下での回転行列の2次元幾何増分式,(3)回転行列とポーズの正しい描画ルーチンの導出,(4)フルレンジの頭部ポーズデータセット生成のための適切なピッチヨットカバレッジを可能にする数学的実験と検証を行うことによって,これらの制限に対処した。
提案手法を既存の頭部ポーズ推定法に適用することにより,モデルの性能が大幅に向上した。
コードは受理後に公開される。
関連論文リスト
- 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - Mathematical Foundation and Corrections for Full Range Head Pose Estimation [16.697345330120744]
回転行列が座標系に依存することはよく知られており、ヨー、ロール、ピッチ角はそれらの適用順序に敏感である。
本稿では,300W-LPデータセットで定義されたEuler角,3DDFA-v2,6D-RepNet,WHENetなどの頭部ポーズ推定,およびEuler角の描画ルーチンの有効性について詳しく検討した。
必要であれば、提供されたコードから座標系とヨー、ロール、ピッチのシーケンスを推測する。
論文 参考訳(メタデータ) (2024-03-26T21:04:18Z) - Towards Robust and Unconstrained Full Range of Rotation Head Pose
Estimation [2.915868985330569]
本稿では,非拘束型終端頭部ポーズ推定のための新しい手法を提案する。
効率的かつロバストな直接回帰のための連続6次元回転行列表現を提案する。
提案手法は,他の最先端手法よりも効率的かつロバストに優れる。
論文 参考訳(メタデータ) (2023-09-14T12:17:38Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Category-Level 6D Object Pose Estimation with Flexible Vector-Based
Rotation Representation [51.67545893892129]
モノクロRGB-D画像からカテゴリレベルの6次元ポーズとサイズ推定のための新しい3次元グラフ畳み込みに基づくパイプラインを提案する。
まず,3次元グラフ畳み込みを用いた向き対応オートエンコーダの設計を行った。
そして, 回転情報を潜在特徴から効率的に復号化するために, フレキシブルなベクトルベースデコンポーザブルな回転表現を設計する。
論文 参考訳(メタデータ) (2022-12-09T02:13:43Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - 6D Rotation Representation For Unconstrained Head Pose Estimation [2.1485350418225244]
本研究は, 基底真理データに対する回転行列形式を導入して, あいまいな回転ラベルの問題に対処する。
このようにして、提案手法は、ポーズ予測を狭角に制限する従来のアプローチとは正反対に、全回転の外観を学習することができる。
AFLW2000およびBIWIデータセットを用いた実験により,提案手法が他の最先端手法よりも最大20%高い性能を示した。
論文 参考訳(メタデータ) (2022-02-25T08:41:13Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z) - GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D
Object Pose Estimation [71.83992173720311]
単一のRGB画像からの6次元ポーズ推定はコンピュータビジョンの基本課題である。
GDR-Net(Geometry-Guided Direct Regression Network)を用いて6Dポーズをエンドツーエンドで学習する。
提案手法は, LM, LM-O, YCB-Vデータセットの最先端手法よりも優れている。
論文 参考訳(メタデータ) (2021-02-24T09:11:31Z) - Calculating Pose with Vanishing Points of Visual-Sphere Perspective
Model [0.0]
提案手法の目的は, 推定することなく, 既知の長方形対象のポーズ行列を直接取得することである。
この方法は、魚眼カメラビューのような180degの視野を超えるリアルタイムで極端な撮影装置に特化している。
論文 参考訳(メタデータ) (2020-04-19T18:39:08Z) - HP2IFS: Head Pose estimation exploiting Partitioned Iterated Function
Systems [18.402636415604373]
2次元画像から実際の頭部方向を推定することはよく知られた問題である。
フラクタル符号理論と分割反復システムを用いて入力ヘッド画像からフラクタル符号を抽出する。
提案手法は,正確なYaw/pitch/roll角値を提供する。
論文 参考訳(メタデータ) (2020-03-25T17:56:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。