論文の概要: An Efficient Multitask Neural Network for Face Alignment, Head Pose
Estimation and Face Tracking
- arxiv url: http://arxiv.org/abs/2103.07615v1
- Date: Sat, 13 Mar 2021 04:41:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-18 03:16:57.249266
- Title: An Efficient Multitask Neural Network for Face Alignment, Head Pose
Estimation and Face Tracking
- Title(参考訳): 顔アライメント、頭部ポーズ推定、顔追跡のための効率的なマルチタスクニューラルネットワーク
- Authors: Jiahao Xia, Haimin Zhang, Shiping Wen, Shuo Yang and Min Xu
- Abstract要約: 効率的なマルチタスク顔アライメント、顔追跡、頭部ポーズ推定ネットワーク(ATPN)を提案します。
ATPNは従来の最先端手法に比べて性能が向上し、パラメータやFLOPSは少ない。
- 参考スコア(独自算出の注目度): 9.39854778804018
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While convolutional neural networks (CNNs) have significantly boosted the
performance of face related algorithms, maintaining accuracy and efficiency
simultaneously in practical use remains challenging. Recent study shows that
using a cascade of hourglass modules which consist of a number of bottom-up and
top-down convolutional layers can extract facial structural information for
face alignment to improve accuracy. However, previous studies have shown that
features produced by shallow convolutional layers are highly correspond to
edges. These features could be directly used to provide the structural
information without addition cost. Motivated by this intuition, we propose an
efficient multitask face alignment, face tracking and head pose estimation
network (ATPN). Specifically, we introduce a shortcut connection between
shallow-layer features and deep-layer features to provide the structural
information for face alignment and apply the CoordConv to the last few layers
to provide coordinate information. The predicted facial landmarks enable us to
generate a cheap heatmap which contains both geometric and appearance
information for head pose estimation and it also provides attention clues for
face tracking. Moreover, the face tracking task saves us the face detection
procedure for each frame, which is significant to boost performance for
video-based tasks. The proposed framework is evaluated on four benchmark
datasets, WFLW, 300VW, WIDER Face and 300W-LP. The experimental results show
that the ATPN achieves improved performance compared to previous
state-of-the-art methods while having less number of parameters and FLOPS.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は顔関連アルゴリズムの性能を大幅に向上させたが、実用上は精度と効率を同時に維持することは困難である。
近年の研究では、多数のボトムアップ層とトップダウン層からなる砂時計モジュールのカスケードを用いて、顔アライメントのための顔構造情報を抽出し、精度を向上させることが示されている。
しかし、従来の研究では、浅い畳み込み層が生み出す特徴がエッジと非常に一致していることが示されている。
これらの機能は、追加コストなしで構造情報を提供するために直接使用できる。
この直感により,効率的なマルチタスク顔アライメント,顔追跡,頭部ポーズ推定ネットワーク(ATPN)を提案する。
具体的には,浅層特徴と深層特徴とのショートカット接続を導入し,顔アライメントの構造情報を提供し,最後の数層にcoordconvを適用して座標情報を提供する。
予測された顔のランドマークは、頭部ポーズ推定のための幾何情報と外観情報の両方を含む安価なヒートマップを生成することができ、顔追跡のための注意情報も提供する。
さらに、顔追跡タスクは、各フレームの顔検出手順を省き、ビデオベースタスクのパフォーマンス向上に寄与する。
提案手法は,WFLW,300VW,WIDER Face,300W-LPの4つのベンチマークデータセットを用いて評価した。
実験の結果,ATPNは従来の最先端手法に比べて性能が向上し,パラメータやFLOPSは少ないことがわかった。
関連論文リスト
- Improving Neural Surface Reconstruction with Feature Priors from Multi-View Image [87.00660347447494]
ニューラルサーフェス・コンストラクション(NSR)の最近の進歩は、ボリュームレンダリングと組み合わせることで、マルチビュー・コンストラクションを著しく改善している。
本稿では,多種多様な視覚的タスクから価値ある特徴を活用すべく,特徴レベルの一貫した損失について検討する。
DTU と EPFL を用いて解析した結果,画像マッチングと多視点ステレオデータセットによる特徴が,他のプリテキストタスクよりも優れていたことが判明した。
論文 参考訳(メタデータ) (2024-08-04T16:09:46Z) - Faceptor: A Generalist Model for Face Perception [52.8066001012464]
Faceptorは、よく設計されたシングルエンコーダのデュアルデコーダアーキテクチャを採用するために提案されている。
Faceptorへのレイヤアテンションにより、モデルが最適なレイヤから機能を適応的に選択して、望ましいタスクを実行することができる。
我々のトレーニングフレームワークは補助的な教師付き学習にも適用でき、年齢推定や表現認識といったデータスパースタスクの性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2024-03-14T15:42:31Z) - Implicit Shape and Appearance Priors for Few-Shot Full Head
Reconstruction [17.254539604491303]
本稿では,数発のフル3次元頭部再構成の問題点に対処する。
我々は、座標に基づく表現に先立って確率的形状と外観を組み込むことにより、これを達成した。
我々はH3DSデータセットを拡張し、60個の高解像度3Dフルヘッドスキャンと対応する画像とマスクを含む。
論文 参考訳(メタデータ) (2023-10-12T07:35:30Z) - 3D Face Alignment Through Fusion of Head Pose Information and Features [0.6526824510982799]
顔アライメント性能を向上させるために頭部ポーズ情報を利用する新しい手法を提案する。
提案するネットワーク構造は,2次元ネットワークを介して頑健な顔アライメントを行う。
予測された顔のランドマークと頭部ポーズ情報との相関と,顔のランドマークの精度の変動を実験的に評価した。
論文 参考訳(メタデータ) (2023-08-25T12:01:24Z) - Neural Point-based Volumetric Avatar: Surface-guided Neural Points for
Efficient and Photorealistic Volumetric Head Avatar [62.87222308616711]
ニューラルポイント表現とニューラルボリュームレンダリングプロセスを採用したフルネーム(名前)を提案する。
具体的には、ニューラルポイントは高分解能UV変位マップを介してターゲット表現の表面を戦略的に拘束する。
設計上は,アバターをアニメーションする際の正確な表現制御を確保しつつ,地形的に変化する領域や細い構造を扱えるように設計されている。
論文 参考訳(メタデータ) (2023-07-11T03:40:10Z) - EfficientFace: An Efficient Deep Network with Feature Enhancement for
Accurate Face Detection [20.779512288834315]
現在の軽量なCNNベースの顔検出器は、効率の取引精度が不十分で、特徴表現が不十分である。
本研究では,機能強化のための3つのモジュールを含むEfficientFaceと呼ばれる効率的なディープフェイス検出器を設計する。
4つの公開ベンチマークでEfficientFaceを評価し,その有効性を実証した。
論文 参考訳(メタデータ) (2023-02-23T06:59:45Z) - EResFD: Rediscovery of the Effectiveness of Standard Convolution for
Lightweight Face Detection [13.357235715178584]
顔検出のための軽量バックボーンアーキテクチャとして,標準的な畳み込みブロックの有効性を再検討する。
チャネル切断された標準畳み込み層は精度と推論速度を向上できることを示す。
提案する検出器EResFDは,CPU上でのVGA画像推測に37.7msしか要しないWIDER FACE Hardサブセット上で80.4%のmAPを得た。
論文 参考訳(メタデータ) (2022-04-04T02:30:43Z) - A Deeper Look into DeepCap [96.67706102518238]
そこで本研究では,単分子密集型人間のパフォーマンスキャプチャのための新しい深層学習手法を提案する。
本手法は,多視点監視に基づく弱教師付き方式で訓練されている。
我々のアプローチは、品質と堅牢性の観点から、芸術の状態を上回ります。
論文 参考訳(メタデータ) (2021-11-20T11:34:33Z) - SE-PSNet: Silhouette-based Enhancement Feature for Panoptic Segmentation
Network [5.353718408751182]
汎視的セグメンテーション課題に取り組むための解決策を提案する。
この構造はボトムアップ法とトップダウン法を組み合わせたものである。
ネットワークは主にマスクの品質に注意を払う。
論文 参考訳(メタデータ) (2021-07-11T17:20:32Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Deep Spatial Gradient and Temporal Depth Learning for Face Anti-spoofing [61.82466976737915]
深層学習は、顔の反偽造の最も効果的な方法の1つとして証明されている。
2つの洞察に基づいて,複数フレームからの提示攻撃を検出する新しい手法を提案する。
提案手法は,5つのベンチマークデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2020-03-18T06:11:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。