論文の概要: A Vector-based Representation to Enhance Head Pose Estimation
- arxiv url: http://arxiv.org/abs/2010.07184v2
- Date: Tue, 8 Dec 2020 21:44:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 13:47:19.955872
- Title: A Vector-based Representation to Enhance Head Pose Estimation
- Title(参考訳): 頭部ポーズ推定のためのベクトルに基づく表現法
- Authors: Zhiwen Cao, Zongcheng Chu, Dongfang Liu, Yingjie Chen
- Abstract要約: 本稿では,回転行列における3つのベクトルを頭部ポーズ推定の表現として用いることを提案する。
我々はそのような表現の特徴に基づく新しいニューラルネットワークを開発する。
- 参考スコア(独自算出の注目度): 4.329951775163721
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes to use the three vectors in a rotation matrix as the
representation in head pose estimation and develops a new neural network based
on the characteristic of such representation. We address two potential issues
existed in current head pose estimation works: 1. Public datasets for head pose
estimation use either Euler angles or quaternions to annotate data samples.
However, both of these annotations have the issue of discontinuity and thus
could result in some performance issues in neural network training. 2. Most
research works report Mean Absolute Error (MAE) of Euler angles as the
measurement of performance. We show that MAE may not reflect the actual
behavior especially for the cases of profile views. To solve these two
problems, we propose a new annotation method which uses three vectors to
describe head poses and a new measurement Mean Absolute Error of Vectors (MAEV)
to assess the performance. We also train a new neural network to predict the
three vectors with the constraints of orthogonality. Our proposed method
achieves state-of-the-art results on both AFLW2000 and BIWI datasets.
Experiments show our vector-based annotation method can effectively reduce
prediction errors for large pose angles.
- Abstract(参考訳): 本稿では,回転行列における3つのベクトルを頭部ポーズ推定の表現として用いることを提案し,その表現の特徴に基づく新しいニューラルネットワークを開発した。
現在の頭部姿勢推定作業には2つの潜在的な問題が存在する。
1. 頭部ポーズ推定のための公開データセットは、ユーラー角または四元数を用いてデータサンプルを注釈付けする。
しかしながら、これらのアノテーションはいずれも不連続性の問題であり、ニューラルネットワークトレーニングのパフォーマンス上の問題を引き起こす可能性がある。
2. 大半の研究は, 性能測定としてオイラー角の平均絶対誤差(MAE)を報告している。
特にプロファイルビューの場合,maeは実際の動作を反映しない可能性がある。
これら2つの問題を解決するために, 3つのベクトルを用いて頭部ポーズを記述する新しいアノテーション法と, ベクトルの絶対誤差測定法(maev)を提案する。
また、直交性の制約で3つのベクトルを予測するために、新しいニューラルネットワークをトレーニングします。
提案手法は, AFLW2000 と BIWI の両方のデータセットに対して, 最先端の結果を得られる。
提案手法は,大規模なポーズ角の予測誤差を効果的に低減できることを示す。
関連論文リスト
- Occlusion Handling in 3D Human Pose Estimation with Perturbed Positional Encoding [15.834419910916933]
固有基底から一貫した正規成分を抽出する新しい位置符号化手法PerturbPEを提案する。
実験結果では,Human3.6Mデータセットで最大12%のパフォーマンス向上が観測された。
我々の新しいアプローチは、2つのエッジが欠落しているシナリオのパフォーマンスを大幅に向上させ、最先端のベンチマークを新たに設定する。
論文 参考訳(メタデータ) (2024-05-27T17:48:54Z) - DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - Category-Level 6D Object Pose Estimation with Flexible Vector-Based
Rotation Representation [51.67545893892129]
モノクロRGB-D画像からカテゴリレベルの6次元ポーズとサイズ推定のための新しい3次元グラフ畳み込みに基づくパイプラインを提案する。
まず,3次元グラフ畳み込みを用いた向き対応オートエンコーダの設計を行った。
そして, 回転情報を潜在特徴から効率的に復号化するために, フレキシブルなベクトルベースデコンポーザブルな回転表現を設計する。
論文 参考訳(メタデータ) (2022-12-09T02:13:43Z) - An Intuitive and Unconstrained 2D Cube Representation for Simultaneous
Head Detection and Pose Estimation [24.04477340811483]
直感的手法による新しい単一ステージ鍵ベース手法を提案し,その2次元立方体表現を結合頭部検出とポーズ推定のために提案する。
提案手法は,AFLW2000およびBIWIデータセット上の他の代表手法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-12-07T13:28:50Z) - Perspective-1-Ellipsoid: Formulation, Analysis and Solutions of the
Camera Pose Estimation Problem from One Ellipse-Ellipsoid Correspondence [1.7188280334580193]
我々は,エリスポイド固有の理論的枠組みを導入し,ポーズ推定の文脈で有用性を示す。
提案手法により, 位置や方向のみの推定問題に対して, ポーズ推定問題を低減できることを示す。
論文 参考訳(メタデータ) (2022-08-26T09:15:20Z) - Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。
テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文 参考訳(メタデータ) (2022-06-17T04:07:45Z) - On Triangulation as a Form of Self-Supervision for 3D Human Pose
Estimation [57.766049538913926]
ラベル付きデータが豊富である場合, 単一画像からの3次元ポーズ推定に対する改良されたアプローチは, 極めて効果的である。
最近の注目の多くは、セミと(あるいは)弱い教師付き学習に移行している。
本稿では,多視点の幾何学的制約を,識別可能な三角測量を用いて課し,ラベルがない場合の自己監督の形式として用いることを提案する。
論文 参考訳(メタデータ) (2022-03-29T19:11:54Z) - 6D Rotation Representation For Unconstrained Head Pose Estimation [2.1485350418225244]
本研究は, 基底真理データに対する回転行列形式を導入して, あいまいな回転ラベルの問題に対処する。
このようにして、提案手法は、ポーズ予測を狭角に制限する従来のアプローチとは正反対に、全回転の外観を学習することができる。
AFLW2000およびBIWIデータセットを用いた実験により,提案手法が他の最先端手法よりも最大20%高い性能を示した。
論文 参考訳(メタデータ) (2022-02-25T08:41:13Z) - HHP-Net: A light Heteroscedastic neural network for Head Pose estimation
with uncertainty [2.064612766965483]
そこで,本研究では,頭部キーポイントの小さなセットから始まる,単一画像中の人物の頭部ポーズを推定する新しい手法を提案する。
私たちのモデルは実装が簡単で、芸術の状況に関してより効率的です。
論文 参考訳(メタデータ) (2021-11-02T08:55:45Z) - Improving Aspect-based Sentiment Analysis with Gated Graph Convolutional
Networks and Syntax-based Regulation [89.38054401427173]
Aspect-based Sentiment Analysis (ABSA) は、特定の側面に向けて文の感情極性を予測する。
依存関係ツリーは、ABSAの最先端のパフォーマンスを生成するために、ディープラーニングモデルに統合することができる。
本稿では,この2つの課題を克服するために,グラフに基づく新しいディープラーニングモデルを提案する。
論文 参考訳(メタデータ) (2020-10-26T07:36:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。