論文の概要: Towards a Real-Time Facial Analysis System
- arxiv url: http://arxiv.org/abs/2109.10393v1
- Date: Tue, 21 Sep 2021 18:27:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-23 13:53:32.145861
- Title: Towards a Real-Time Facial Analysis System
- Title(参考訳): リアルタイム顔分析システムに向けて
- Authors: Bishwo Adhikari, Xingyang Ni, Esa Rahtu, Heikki Huttunen
- Abstract要約: 本稿では,リアルタイム顔分析システムのシステムレベル設計について述べる。
オブジェクトの検出、分類、回帰のためのディープニューラルネットワークのコレクションにより、カメラビューに現れる各人物の年齢、性別、表情、顔の類似性を認識する。
一般的なオフ・ザ・シェルフアーキテクチャの結果、システムの精度は最先端の手法に匹敵し、認識速度はリアルタイムの要求を満たすことが示された。
- 参考スコア(独自算出の注目度): 13.649384403827359
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Facial analysis is an active research area in computer vision, with many
practical applications. Most of the existing studies focus on addressing one
specific task and maximizing its performance. For a complete facial analysis
system, one needs to solve these tasks efficiently to ensure a smooth
experience. In this work, we present a system-level design of a real-time
facial analysis system. With a collection of deep neural networks for object
detection, classification, and regression, the system recognizes age, gender,
facial expression, and facial similarity for each person that appears in the
camera view. We investigate the parallelization and interplay of individual
tasks. Results on common off-the-shelf architecture show that the system's
accuracy is comparable to the state-of-the-art methods, and the recognition
speed satisfies real-time requirements. Moreover, we propose a multitask
network for jointly predicting the first three attributes, i.e., age, gender,
and facial expression. Source code and trained models are available at
https://github.com/mahehu/TUT-live-age-estimator.
- Abstract(参考訳): 顔分析はコンピュータビジョンの活発な研究領域であり、多くの実用的応用がある。
既存の研究のほとんどは、特定のタスクに対処し、パフォーマンスを最大化することに焦点を当てている。
完全な顔分析システムでは、スムーズな体験を確保するためにこれらのタスクを効率的に解決する必要がある。
本研究では,リアルタイム顔分析システムのシステムレベル設計について述べる。
オブジェクトの検出、分類、回帰のためのディープニューラルネットワークの集合により、システムは、カメラビューに現れる人の年齢、性別、表情、顔の類似性を認識する。
個別タスクの並列化と相互運用について検討する。
一般的なオフ・ザ・シェルフアーキテクチャの結果、システムの精度は最先端の手法に匹敵し、認識速度はリアルタイム要件を満たすことが示された。
さらに,最初の3つの属性,すなわち年齢,性別,表情を共同で予測するマルチタスクネットワークを提案する。
ソースコードとトレーニングされたモデルはhttps://github.com/mahehu/tut-live-age-estimatorで入手できる。
関連論文リスト
- DeepFace-Attention: Multimodal Face Biometrics for Attention Estimation with Application to e-Learning [18.36413246876648]
本研究では,Webカメラビデオに適用した顔分析手法のアンサンブルを用いて,注意レベル(認知的負荷)を推定する革新的な手法を提案する。
我々のアプローチは、最先端の顔分析技術を適用し、ユーザの認知的負荷を、高い注意や低い注意の形で定量化する。
提案手法は,mEBAL2ベンチマークを用いて,既存の最先端の精度を向上する。
論文 参考訳(メタデータ) (2024-08-10T11:39:11Z) - Task-adaptive Q-Face [75.15668556061772]
本稿では,タスク適応型マルチタスク顔分析手法Q-Faceを提案する。
Q-Faceは統合されたモデルで複数の顔分析タスクを同時に実行する。
本手法は,顔表情認識,行動単位検出,顔属性分析,年齢推定,顔ポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-05-15T03:13:11Z) - FaceXFormer: A Unified Transformer for Facial Analysis [59.94066615853198]
FaceXformerは、さまざまな顔分析タスクのためのエンドツーエンドの統一トランスフォーマーモデルである。
本モデルでは,8つのタスクにまたがる頑健さと一般化性を実証し,画像の「夢中」を効果的に処理する。
論文 参考訳(メタデータ) (2024-03-19T17:58:04Z) - Faceptor: A Generalist Model for Face Perception [52.8066001012464]
Faceptorは、よく設計されたシングルエンコーダのデュアルデコーダアーキテクチャを採用するために提案されている。
Faceptorへのレイヤアテンションにより、モデルが最適なレイヤから機能を適応的に選択して、望ましいタスクを実行することができる。
我々のトレーニングフレームワークは補助的な教師付き学習にも適用でき、年齢推定や表現認識といったデータスパースタスクの性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2024-03-14T15:42:31Z) - A Real-Time Multi-Task Learning System for Joint Detection of Face,
Facial Landmark and Head Pose [3.661587008381534]
極度の頭位姿勢は、さまざまな顔分析タスクに共通の課題をもたらす。
本稿では,これらのタスクの統合,特に大角顔のポーズによって生じる複雑さに対処することに焦点を当てる。
本研究の主な貢献は,リアルタイムマルチタスク検出システムの提案である。
論文 参考訳(メタデータ) (2023-09-21T04:15:26Z) - SwinFace: A Multi-task Transformer for Face Recognition, Expression
Recognition, Age Estimation and Attribute Estimation [60.94239810407917]
本論文では,単一スウィントランスを用いた顔認識,表情認識,年齢推定,顔属性推定のための多目的アルゴリズムを提案する。
複数のタスク間の競合に対処するため、マルチレベルチャネル注意(MLCA)モジュールをタスク固有の分析に統合する。
実験の結果,提案したモデルでは顔の理解が良く,全てのタスクにおいて優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-08-22T15:38:39Z) - Robustness Disparities in Face Detection [64.71318433419636]
本稿では,その顔検出システムの詳細なベンチマークとして,商業モデルと学術モデルのノイズに対する頑健性について検討する。
すべてのデータセットやシステム全体で、$textitmasculineである個人の写真が$textitdarker skin type$$$、$textitdarker$、または$textitdim lighting$は、他のIDよりもエラーの影響を受けやすい。
論文 参考訳(メタデータ) (2022-11-29T05:22:47Z) - Pre-training strategies and datasets for facial representation learning [58.8289362536262]
いくつかの顔分析タスクやデータセットに適用可能な普遍的な顔表現の探索方法を示す。
顔に適応する2つの大規模表現学習を体系的に検討する。
私たちの主な2つの発見は以下の通りです: 完全にインザワイルドな未処理データに対する教師なし事前トレーニングは一貫性を提供し、場合によっては大幅な精度向上をもたらします。
論文 参考訳(メタデータ) (2021-03-30T17:57:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。