論文の概要: On the representation and methodology for wide and short range head pose
estimation
- arxiv url: http://arxiv.org/abs/2401.05807v1
- Date: Thu, 11 Jan 2024 10:20:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-12 15:15:15.977343
- Title: On the representation and methodology for wide and short range head pose
estimation
- Title(参考訳): 広近距離頭部ポーズ推定のための表現と方法論について
- Authors: Alejandro Cobo and Roberto Valle and Jos\'e M. Buenaposada and Luis
Baumela
- Abstract要約: 頭部ポーズ推定(HPE)はコンピュータビジョンにおける問題である。
近年の応用には、全360度回転範囲の顔の分析が必要である。
半フロントケースとプロファイルケースを解く従来のアプローチは、フルローテーションケースには直接適用できない。
- 参考スコア(独自算出の注目度): 48.87319013701136
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Head pose estimation (HPE) is a problem of interest in computer vision to
improve the performance of face processing tasks in semi-frontal or profile
settings. Recent applications require the analysis of faces in the full
360{\deg} rotation range. Traditional approaches to solve the semi-frontal and
profile cases are not directly amenable for the full rotation case. In this
paper we analyze the methodology for short- and wide-range HPE and discuss
which representations and metrics are adequate for each case. We show that the
popular Euler angles representation is a good choice for short-range HPE, but
not at extreme rotations. However, the Euler angles' gimbal lock problem
prevents them from being used as a valid metric in any setting. We also revisit
the current cross-data set evaluation methodology and note that the lack of
alignment between the reference systems of the training and test data sets
negatively biases the results of all articles in the literature. We introduce a
procedure to quantify this misalignment and a new methodology for cross-data
set HPE that establishes new, more accurate, SOTA for the 300W-LP|Biwi
benchmark. We also propose a generalization of the geodesic angular distance
metric that enables the construction of a loss that controls the contribution
of each training sample to the optimization of the model. Finally, we introduce
a wide range HPE benchmark based on the CMU Panoptic data set.
- Abstract(参考訳): HPE(Head pose Estimation)は、半正面またはプロファイル設定における顔処理タスクの性能向上を目的としたコンピュータビジョンの課題である。
最近の応用では、完全な360{\deg}回転範囲の顔の分析が必要である。
半フロントケースとプロファイルケースを解く従来のアプローチは、フルローテーションケースには直接適用できない。
本稿では,短距離HPEの方法論を解析し,各ケースにどの表現やメトリクスが適切かについて議論する。
一般のオイラー角表現は短距離 hpe に対して良い選択であるが、極端に回転しないことを示す。
しかし、オイラー角のジンバルロック問題は、任意の設定で有効な計量として使われるのを妨げている。
また、現在のクロスデータ集合評価手法を再検討し、トレーニングとテストデータセットの参照システム間のアライメントの欠如は、文献の全記事の結果に負の偏りがあることに注意する。
提案手法は,300W-LP|Biwiベンチマークのための新しい,より正確なSOTAを確立するクロスデータセットHPEの新しい手法である。
また,モデルの最適化に対する各トレーニングサンプルの寄与を制御する損失の構築を可能にする測地線角距離メトリックの一般化を提案する。
最後に,CMU Panoptic データセットに基づく広域 HPE ベンチマークを提案する。
関連論文リスト
- For A More Comprehensive Evaluation of 6DoF Object Pose Tracking [22.696375341994035]
上記の問題に対処するために、統一されたベンチマークに貢献する。
YCBVのより正確なアノテーションとして,多視点多目的グローバルポーズ改善法を提案する。
実験では,リアルな半合成データセットを用いて,提案手法の精度と信頼性を検証した。
論文 参考訳(メタデータ) (2023-09-14T15:35:08Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - EGformer: Equirectangular Geometry-biased Transformer for 360 Depth
Estimation [20.42460078279734]
歪んだ180×360視野を考えると、等方形(すなわち360)画像(EIs)の深さを推定することは困難である。
EGformer と呼ばれる等方形状バイアス変換器を提案する。
論文 参考訳(メタデータ) (2023-04-16T15:14:17Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - Zero-Shot Category-Level Object Pose Estimation [24.822189326540105]
ゼロショット方式で新しい対象カテゴリーのポーズを推定する問題に取り組む。
これは、ポーズラベル付きデータセットやカテゴリ固有のCADモデルの必要性を取り除くことで、既存の文献の多くを拡張します。
本手法は平均回転精度を30度で6倍改善する。
論文 参考訳(メタデータ) (2022-04-07T17:58:39Z) - Visual SLAM with Graph-Cut Optimized Multi-Plane Reconstruction [11.215334675788952]
本稿では,インスタンス平面セグメンテーションネットワークからのキューを用いたポーズ推定とマッピングを改善する意味平面SLAMシステムを提案する。
メインストリームのアプローチはRGB-Dセンサーを使用するが、そのようなシステムを備えた単眼カメラを使うことは、ロバストデータアソシエーションや正確な幾何モデルフィッティングといった課題に直面している。
論文 参考訳(メタデータ) (2021-08-09T18:16:08Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - PropagationNet: Propagate Points to Curve to Learn Structure Information [79.65125870257009]
熱マップ回帰に基づく構造注入型顔アライメントアルゴリズムを提案する。
また,地中条件下での採鉱・採鉱の難しさを強調したFocal Wing Lossを提案する。
提案手法では,WFLWでは平均誤差が4.05%,300Wでは平均誤差が2.93%,COFWでは平均誤差が3.71%となる。
論文 参考訳(メタデータ) (2020-06-25T11:08:59Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。