論文の概要: MaskFace: multi-task face and landmark detector
- arxiv url: http://arxiv.org/abs/2005.09412v1
- Date: Tue, 19 May 2020 13:09:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 14:17:10.126080
- Title: MaskFace: multi-task face and landmark detector
- Title(参考訳): MaskFace:マルチタスク顔とランドマーク検出器
- Authors: Dmitry Yashunin, Tamir Baydasov, Roman Vlasov
- Abstract要約: 顔およびランドマーク検出のための高精度なモデルを提案する。
MaskFaceと呼ばれるこの方法は、キーポイント予測ヘッドを追加することで、以前の顔検出アプローチを拡張している。
AFW,PASCAL顔,FDDB,WIDER FACEデータセットおよびAFLW,300WデータセットのランドマークローカライズタスクにおけるMaskFaceの性能を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Currently in the domain of facial analysis single task approaches for face
detection and landmark localization dominate. In this paper we draw attention
to multi-task models solving both tasks simultaneously. We present a highly
accurate model for face and landmark detection. The method, called MaskFace,
extends previous face detection approaches by adding a keypoint prediction
head. The new keypoint head adopts ideas of Mask R-CNN by extracting facial
features with a RoIAlign layer. The keypoint head adds small computational
overhead in the case of few faces in the image while improving the accuracy
dramatically. We evaluate MaskFace's performance on a face detection task on
the AFW, PASCAL face, FDDB, WIDER FACE datasets and a landmark localization
task on the AFLW, 300W datasets. For both tasks MaskFace achieves
state-of-the-art results outperforming many of single-task and multi-task
models.
- Abstract(参考訳): 現在、顔分析の領域では、顔検出とランドマークのローカライゼーションのための単一タスクアプローチが主流である。
本稿では,両タスクを同時に解くマルチタスクモデルに注目する。
顔およびランドマーク検出のための高精度なモデルを提案する。
MaskFaceと呼ばれるこの方法は、キーポイント予測ヘッドを追加することで、以前の顔検出アプローチを拡張する。
新しいキーポイントヘッドは、RoIAlign層で顔の特徴を抽出することで、Mask R-CNNのアイデアを採用する。
キーポイントヘッドは、画像内の顔が少ない場合の計算オーバーヘッドを小さくし、精度を劇的に改善する。
AFW,PASCAL顔,FDDB,WIDER FACEデータセットおよびAFLW,300Wデータセットのランドマーク局所化タスクにおけるMaskFaceの性能を評価する。
両方のタスクに対して、MaskFaceは最先端の結果を達成し、シングルタスクとマルチタスクモデルの多くを上回ります。
関連論文リスト
- Task-adaptive Q-Face [75.15668556061772]
本稿では,タスク適応型マルチタスク顔分析手法Q-Faceを提案する。
Q-Faceは統合されたモデルで複数の顔分析タスクを同時に実行する。
本手法は,顔表情認識,行動単位検出,顔属性分析,年齢推定,顔ポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-05-15T03:13:11Z) - FaceXFormer: A Unified Transformer for Facial Analysis [59.94066615853198]
FaceXformerは、さまざまな顔分析タスクのためのエンドツーエンドの統一トランスフォーマーモデルである。
本モデルでは,8つのタスクにまたがる頑健さと一般化性を実証し,画像の「夢中」を効果的に処理する。
論文 参考訳(メタデータ) (2024-03-19T17:58:04Z) - Toward High Quality Facial Representation Learning [58.873356953627614]
我々はMask Contrastive Face (MCF)と呼ばれる自己教師型事前学習フレームワークを提案する。
トレーニング済みの視覚バックボーンの特徴マップを監視項目として使用し、マスク画像モデリングに部分的にトレーニング済みのデコーダを使用する。
このモデルはAFLW-19顔アライメントの0.932 NME_diag$とLaPa顔解析の93.96 F1スコアを達成する。
論文 参考訳(メタデータ) (2023-09-07T09:11:49Z) - SwinFace: A Multi-task Transformer for Face Recognition, Expression
Recognition, Age Estimation and Attribute Estimation [60.94239810407917]
本論文では,単一スウィントランスを用いた顔認識,表情認識,年齢推定,顔属性推定のための多目的アルゴリズムを提案する。
複数のタスク間の競合に対処するため、マルチレベルチャネル注意(MLCA)モジュールをタスク固有の分析に統合する。
実験の結果,提案したモデルでは顔の理解が良く,全てのタスクにおいて優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-08-22T15:38:39Z) - DPPMask: Masked Image Modeling with Determinantal Point Processes [49.65141962357528]
Masked Image Modeling (MIM)は、ランダムにマスキングされた画像の再構成を目的として、印象的な代表的性能を達成した。
先行研究で広く使われている一様ランダムマスキングは、必然的にいくつかの重要なオブジェクトを失い、元のセマンティック情報を変更する。
この問題に対処するため、MIMを新しいマスキング戦略であるDPPMaskで強化する。
提案手法は単純だが有効であり,様々なフレームワークで実装される場合,余分に学習可能なパラメータは不要である。
論文 参考訳(メタデータ) (2023-03-13T13:40:39Z) - FaceOcc: A Diverse, High-quality Face Occlusion Dataset for Human Face
Extraction [3.8502825594372703]
隠蔽は野生の顔画像にしばしば発生し、ランドマーク検出や3D再構成、顔認識といった顔関連の課題に悩まされる。
本稿では,CelebA本社とインターネットから手動で顔の隠蔽をラベル付けした新しい顔のセグメンテーションデータセットを提案する。
簡単な顔分割モデルの訓練を行ったが,SOTA性能が得られ,提案したデータセットの有効性を実証した。
論文 参考訳(メタデータ) (2022-01-20T19:44:18Z) - MaskMTL: Attribute prediction in masked facial images with deep
multitask learning [9.91045425400833]
本稿では,マスク付き顔画像から多種多様な特徴を共同で推定する深層マルチタスク学習(MTL)手法を提案する。
提案手法は、他の競合技術よりも性能が優れている。
論文 参考訳(メタデータ) (2022-01-09T13:03:29Z) - FocusFace: Multi-task Contrastive Learning for Masked Face Recognition [4.420321822469077]
SARS-CoV-2は科学界に直接的かつ間接的な課題を提示した。
顔認識手法は、マスクやマスクされていない個人に類似した精度で身元確認を行うのに苦労する。
本研究では,マルチタスクアーキテクチャであるFocusFaceを提案する。
論文 参考訳(メタデータ) (2021-10-28T08:17:12Z) - MLFW: A Database for Face Recognition on Masked Faces [56.441078419992046]
Masked LFW (MLFW) は、マスクのない顔からマスクされた顔を自動的に生成するツールである。
SOTAモデルの認識精度は、元の画像の精度と比較して、MLFWデータベース上で5%-16%低下する。
論文 参考訳(メタデータ) (2021-09-13T09:30:10Z) - Boosting Masked Face Recognition with Multi-Task ArcFace [0.973681576519524]
新型コロナウイルス(COVID-19)による世界的な健康危機を考えると、口と鼻を覆うマスクは日常の衣服に欠かせないものになっています。
この尺度は、マスクされた顔で機能するよう設計されていないため、最先端の顔認識モデルをロープに乗せている。
完全なトレーニングパイプラインがArcFace作業に基づいて提示され、バックボーンとロス関数のいくつかの修正が行われている。
論文 参考訳(メタデータ) (2021-04-20T10:12:04Z) - Towards NIR-VIS Masked Face Recognition [47.00916333095693]
近赤外可視(NIR-VIS)顔認識は異種顔認識において最も一般的な症例である。
2つのドメインの顔表現で共有される相互情報を最大化するための新しいトレーニング手法を提案する。
さらに、既存のNIR画像からマスク面を合成するために、3次元顔再構成に基づくアプローチを用いる。
論文 参考訳(メタデータ) (2021-04-14T10:40:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。