論文の概要: EfficientFace: An Efficient Deep Network with Feature Enhancement for
Accurate Face Detection
- arxiv url: http://arxiv.org/abs/2302.11816v1
- Date: Thu, 23 Feb 2023 06:59:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-24 16:12:05.264787
- Title: EfficientFace: An Efficient Deep Network with Feature Enhancement for
Accurate Face Detection
- Title(参考訳): EfficientFace: 正確な顔検出のための特徴強調機能付き効率的なディープネットワーク
- Authors: Guangtao Wang, Jun Li, Zhijian Wu, Jianhua Xu, Jifeng Shen and Wankou
Yang
- Abstract要約: 現在の軽量なCNNベースの顔検出器は、効率の取引精度が不十分で、特徴表現が不十分である。
本研究では,機能強化のための3つのモジュールを含むEfficientFaceと呼ばれる効率的なディープフェイス検出器を設計する。
4つの公開ベンチマークでEfficientFaceを評価し,その有効性を実証した。
- 参考スコア(独自算出の注目度): 20.779512288834315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, deep convolutional neural networks (CNN) have significantly
advanced face detection. In particular, lightweight CNNbased architectures have
achieved great success due to their lowcomplexity structure facilitating
real-time detection tasks. However, current lightweight CNN-based face
detectors trading accuracy for efficiency have inadequate capability in
handling insufficient feature representation, faces with unbalanced aspect
ratios and occlusion. Consequently, they exhibit deteriorated performance far
lagging behind the deep heavy detectors. To achieve efficient face detection
without sacrificing accuracy, we design an efficient deep face detector termed
EfficientFace in this study, which contains three modules for feature
enhancement. To begin with, we design a novel cross-scale feature fusion
strategy to facilitate bottom-up information propagation, such that fusing
low-level and highlevel features is further strengthened. Besides, this is
conducive to estimating the locations of faces and enhancing the descriptive
power of face features. Secondly, we introduce a Receptive Field Enhancement
module to consider faces with various aspect ratios. Thirdly, we add an
Attention Mechanism module for improving the representational capability of
occluded faces. We have evaluated EfficientFace on four public benchmarks and
experimental results demonstrate the appealing performance of our method. In
particular, our model respectively achieves 95.1% (Easy), 94.0% (Medium) and
90.1% (Hard) on validation set of WIDER Face dataset, which is competitive with
heavyweight models with only 1/15 computational costs of the state-of-the-art
MogFace detector.
- Abstract(参考訳): 近年,深層畳み込みニューラルネットワーク(cnn)による顔検出が著しく進んでいる。
特に、軽量CNNベースのアーキテクチャは、リアルタイム検出作業を容易にする低複雑さ構造のため、大きな成功を収めている。
しかし、現在の軽量cnnベースの顔検出装置では、効率性が不十分な特徴表現、不均衡なアスペクト比と咬合を持つ顔を扱う能力が不十分である。
その結果, 深部重度検出器の後方での遅延特性が低下した。
本研究は,精度を犠牲にすることなく効率的な顔検出を実現するため,機能強化のための3つのモジュールを含む効率的な深部顔検出器を考案する。
まず,低レベルの特徴と高レベルの特徴を融合させることにより,ボトムアップ情報伝達を容易にする新しいクロススケール機能融合戦略を設計する。
さらに、これは顔の位置を推定し、顔の特徴の記述力を高めるためにも役立ちます。
第2に,様々なアスペクト比の顔を考慮した受容場拡張モジュールを提案する。
第3に,隠蔽顔の表現能力を向上させるためのアテンションメカニズムモジュールを追加する。
提案手法は,4つのベンチマークで効率性を評価し,その有効性を実験的に実証した。
特に,本モデルはそれぞれ95.1% (イージー),94.0% (medium) および90.1% (hard) を達成し,最先端のmogface検出器の計算コストはわずか1/15のヘビーウェイトモデルと競合している。
関連論文リスト
- Towards More General Video-based Deepfake Detection through Facial Feature Guided Adaptation for Foundation Model [15.61920157541529]
内部にリッチな情報をエンコードしたファンデーションモデルを適用することにより,新しいディープフェイク検出手法を提案する。
近年のパラメータ効率の良い微調整技術に触発されて,新しいサイドネットワーク型デコーダを提案する。
提案手法は,見知らぬディープフェイクサンプルの同定に優れた有効性を示し,顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2024-04-08T14:58:52Z) - DeepFidelity: Perceptual Forgery Fidelity Assessment for Deepfake
Detection [67.3143177137102]
ディープフェイク検出(Deepfake detection)とは、画像やビデオにおいて、人工的に生成された顔や編集された顔を検出すること。
本稿では,実顔と偽顔とを適応的に識別するDeepFidelityという新しいDeepfake検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-07T07:19:45Z) - Neural Point-based Volumetric Avatar: Surface-guided Neural Points for
Efficient and Photorealistic Volumetric Head Avatar [62.87222308616711]
ニューラルポイント表現とニューラルボリュームレンダリングプロセスを採用したフルネーム(名前)を提案する。
具体的には、ニューラルポイントは高分解能UV変位マップを介してターゲット表現の表面を戦略的に拘束する。
設計上は,アバターをアニメーションする際の正確な表現制御を確保しつつ,地形的に変化する領域や細い構造を扱えるように設計されている。
論文 参考訳(メタデータ) (2023-07-11T03:40:10Z) - EfficientSRFace: An Efficient Network with Super-Resolution Enhancement
for Accurate Face Detection [18.977044046941813]
顔検出では、密集した顔予測タスクにおいて、人間の集団の多数の小さな顔のような低解像度の顔が一般的である。
我々は,特徴レベルの超解像再構成ネットワークを導入し,効率的なSRFaceと呼ばれる検出器を開発した。
このモジュールはトレーニングプロセスにおいて補助的な役割を担い、推論時間を増やすことなく推論中に取り除くことができる。
論文 参考訳(メタデータ) (2023-06-04T06:49:44Z) - Pushing the Limits of Asynchronous Graph-based Object Detection with
Event Cameras [62.70541164894224]
低計算を維持しながら、そのようなモデルの深さと複雑さを拡大できるアーキテクチャ選択をいくつか導入する。
我々の手法は、密度の高いグラフニューラルネットワークよりも3.7倍高速に動作し、前方通過はわずか8.4msである。
論文 参考訳(メタデータ) (2022-11-22T15:14:20Z) - EResFD: Rediscovery of the Effectiveness of Standard Convolution for
Lightweight Face Detection [13.357235715178584]
顔検出のための軽量バックボーンアーキテクチャとして,標準的な畳み込みブロックの有効性を再検討する。
チャネル切断された標準畳み込み層は精度と推論速度を向上できることを示す。
提案する検出器EResFDは,CPU上でのVGA画像推測に37.7msしか要しないWIDER FACE Hardサブセット上で80.4%のmAPを得た。
論文 参考訳(メタデータ) (2022-04-04T02:30:43Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Sample and Computation Redistribution for Efficient Face Detection [137.19388513633484]
トレーニングデータサンプリングと計算分布戦略は、効率的で正確な顔検出の鍵です。
scrfdf34は、最高の競合製品であるTinaFaceを3.86%(ハードセットでのAP)で上回り、GPU上でVGA解像度画像でmph3$times$より高速です。
論文 参考訳(メタデータ) (2021-05-10T23:51:14Z) - An Efficient Multitask Neural Network for Face Alignment, Head Pose
Estimation and Face Tracking [9.39854778804018]
効率的なマルチタスク顔アライメント、顔追跡、頭部ポーズ推定ネットワーク(ATPN)を提案します。
ATPNは従来の最先端手法に比べて性能が向上し、パラメータやFLOPSは少ない。
論文 参考訳(メタデータ) (2021-03-13T04:41:15Z) - Improving DeepFake Detection Using Dynamic Face Augmentation [0.8793721044482612]
ほとんどの公開可能なDeepFake検出データセットには、限られたバリエーションがある。
ディープニューラルネットワークは、DeepFakeコンテンツの操作機能を検出するための学習ではなく、顔の特徴にオーバーフィットする傾向があります。
DeepFake検出を改善するために、CNN(Convolutional Neural Networks)をトレーニングするためのデータ拡張方法であるFace-Cutoutを紹介します。
論文 参考訳(メタデータ) (2021-02-18T20:25:45Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。