論文の概要: HHP-Net: A light Heteroscedastic neural network for Head Pose estimation
with uncertainty
- arxiv url: http://arxiv.org/abs/2111.01440v1
- Date: Tue, 2 Nov 2021 08:55:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 14:07:29.534210
- Title: HHP-Net: A light Heteroscedastic neural network for Head Pose estimation
with uncertainty
- Title(参考訳): HHP-Net:不確実性を考慮した頭部電位推定のための光ヘテロセダスティックニューラルネットワーク
- Authors: Giorgio Cantarini, Federico Figari Tomenotti, Nicoletta Noceti,
Francesca Odone
- Abstract要約: そこで,本研究では,頭部キーポイントの小さなセットから始まる,単一画像中の人物の頭部ポーズを推定する新しい手法を提案する。
私たちのモデルは実装が簡単で、芸術の状況に関してより効率的です。
- 参考スコア(独自算出の注目度): 2.064612766965483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we introduce a novel method to estimate the head pose of people
in single images starting from a small set of head keypoints. To this purpose,
we propose a regression model that exploits keypoints computed automatically by
2D pose estimation algorithms and outputs the head pose represented by yaw,
pitch, and roll. Our model is simple to implement and more efficient with
respect to the state of the art -- faster in inference and smaller in terms of
memory occupancy -- with comparable accuracy. Our method also provides a
measure of the heteroscedastic uncertainties associated with the three angles,
through an appropriately designed loss function; we show there is a correlation
between error and uncertainty values, thus this extra source of information may
be used in subsequent computational steps. As an example application, we
address social interaction analysis in images: we propose an algorithm for a
quantitative estimation of the level of interaction between people, starting
from their head poses and reasoning on their mutual positions. The code is
available at https://github.com/cantarinigiorgio/HHP-Net.
- Abstract(参考訳): 本稿では,頭部キーポイントの小さな集合から単眼画像中の人物の頭部姿勢を推定する新しい手法を提案する。
そこで本研究では,2次元ポーズ推定アルゴリズムで計算されたキーポイントを活用し,ヨー,ピッチ,ロールで表される頭部ポーズを出力する回帰モデルを提案する。
私たちのモデルは、技術の現状に関して、実装が簡単で、より効率的です -- 推論が高速で、メモリ占有率の面ではより小さく、同等の精度で。
また, 3つの角度に関する不確かさを, 適切に設計した損失関数を用いて測定し, 誤差と不確実性値の間に相関性があることを示し, この余分な情報源を計算ステップで用いることができることを示した。
画像中の社会的相互作用分析を例として, 頭部のポーズや相互位置の推論から, 人物間の相互作用のレベルを定量的に推定するアルゴリズムを提案する。
コードはhttps://github.com/cantarinigiorgio/hhp-netで入手できる。
関連論文リスト
- DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - VQ-HPS: Human Pose and Shape Estimation in a Vector-Quantized Latent Space [43.368963897752664]
この研究は、ヒューマン・ポースと形状推定の問題に対処する新しいパラダイムを導入している。
身体モデルパラメータを予測する代わりに、提案した離散潜在表現を予測することに重点を置いている。
提案モデルであるVQ-HPSはメッシュの離散潜在表現を予測する。
論文 参考訳(メタデータ) (2023-12-13T17:08:38Z) - Match and Locate: low-frequency monocular odometry based on deep feature
matching [0.65268245109828]
本稿では,1台のカメラしか必要としないロボットオドメトリーの新たなアプローチを提案する。
アプローチは、深い特徴マッチングモデルを用いて、ビデオストリームの連続フレーム間の画像特徴のマッチングに基づいている。
本研究では,AISG-SLAビジュアルローカライゼーションチャレンジにおける手法の性能評価を行い,計算効率が高く,実装が容易であるにもかかわらず,競合する結果が得られた。
論文 参考訳(メタデータ) (2023-11-16T17:32:58Z) - Perspective-1-Ellipsoid: Formulation, Analysis and Solutions of the
Camera Pose Estimation Problem from One Ellipse-Ellipsoid Correspondence [1.7188280334580193]
我々は,エリスポイド固有の理論的枠組みを導入し,ポーズ推定の文脈で有用性を示す。
提案手法により, 位置や方向のみの推定問題に対して, ポーズ推定問題を低減できることを示す。
論文 参考訳(メタデータ) (2022-08-26T09:15:20Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - SIMPLE: SIngle-network with Mimicking and Point Learning for Bottom-up
Human Pose Estimation [81.03485688525133]
Single-network with Mimicking and Point Learning for Bottom-up Human Pose Estimation (SIMPLE) を提案する。
具体的には、トレーニングプロセスにおいて、SIMPLEが高性能なトップダウンパイプラインからのポーズ知識を模倣できるようにする。
さらに、SIMPLEは人間検出とポーズ推定を統一的なポイントラーニングフレームワークとして定式化し、単一ネットワークで相互に補完する。
論文 参考訳(メタデータ) (2021-04-06T13:12:51Z) - Fast Uncertainty Quantification for Deep Object Pose Estimation [91.09217713805337]
深層学習に基づくオブジェクトポーズ推定は、しばしば信頼できない、自信過剰である。
本研究では,6-DoFオブジェクトのポーズ推定のための,シンプルで効率的かつプラグアンドプレイなUQ手法を提案する。
論文 参考訳(メタデータ) (2020-11-16T06:51:55Z) - Deep Convolutional Neural Network-based Bernoulli Heatmap for Head Pose
Estimation [11.676928225717337]
本稿では1枚のRGB画像から頭部ポーズ推定のためのベルヌーイヒートマップを提案する。
本手法は頭部の角度を推定しながら頭部位置を推定できる。
マルチスケール表現を備えたディープ畳み込みニューラルネットワーク(CNN)構造を採用し、高解像度情報を維持する。
論文 参考訳(メタデータ) (2020-05-24T15:36:29Z) - HP2IFS: Head Pose estimation exploiting Partitioned Iterated Function
Systems [18.402636415604373]
2次元画像から実際の頭部方向を推定することはよく知られた問題である。
フラクタル符号理論と分割反復システムを用いて入力ヘッド画像からフラクタル符号を抽出する。
提案手法は,正確なYaw/pitch/roll角値を提供する。
論文 参考訳(メタデータ) (2020-03-25T17:56:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。