論文の概要: ASFD: Automatic and Scalable Face Detector
- arxiv url: http://arxiv.org/abs/2201.10781v1
- Date: Wed, 26 Jan 2022 07:11:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-27 14:19:14.556778
- Title: ASFD: Automatic and Scalable Face Detector
- Title(参考訳): ASFD: 自動かつスケーラブルな顔検出器
- Authors: Jian Li, Bin Zhang, Yabiao Wang, Ying Tai, ZhenYu Zhang, Chengjie
Wang, Jilin Li, Xiaoming Huang, Yili Xia
- Abstract要約: 本稿では,既存の全FAEモジュールをかなりの差で検出し,優れたFAEアーキテクチャであるAutoFAEを探索することを提案する。
特に、当社の強力な ASFD-D6 は WIDER Face テストで AP 96.7/96.2/92.1 よりも優れており、軽量の ASFD-D0 は約3.1 ms で 320 FPS 以上である。
- 参考スコア(独自算出の注目度): 59.31799101216593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Along with current multi-scale based detectors, Feature Aggregation and
Enhancement (FAE) modules have shown superior performance gains for
cutting-edge object detection. However, these hand-crafted FAE modules show
inconsistent improvements on face detection, which is mainly due to the
significant distribution difference between its training and applying corpus,
COCO vs. WIDER Face. To tackle this problem, we essentially analyse the effect
of data distribution, and consequently propose to search an effective FAE
architecture, termed AutoFAE by a differentiable architecture search, which
outperforms all existing FAE modules in face detection with a considerable
margin. Upon the found AutoFAE and existing backbones, a supernet is further
built and trained, which automatically obtains a family of detectors under the
different complexity constraints. Extensive experiments conducted on popular
benchmarks, WIDER Face and FDDB, demonstrate the state-of-the-art
performance-efficiency trade-off for the proposed automatic and scalable face
detector (ASFD) family. In particular, our strong ASFD-D6 outperforms the best
competitor with AP 96.7/96.2/92.1 on WIDER Face test, and the lightweight
ASFD-D0 costs about 3.1 ms, more than 320 FPS, on the V100 GPU with
VGA-resolution images.
- Abstract(参考訳): 現在のマルチスケールベース検出器と並行して、特徴集約・拡張(FAE)モジュールは最先端物体検出において優れた性能向上を示した。
しかし、これらの手作りのFAEモジュールは、主にトレーニングとコーパス、COCO vs. WIDER Faceの相当な分布差のため、顔検出に不整合性を示す。
この問題に対処するため,我々は,データ分散の効果を本質的に分析し,既存のすべてのfaeモジュールをかなりマージンで上回る,差別化可能なアーキテクチャ探索によってautofaeと呼ばれる効果的なfaeアーキテクチャを探索することを提案する。
AutoFAEと既存のバックボーンが見つかると、スーパーネットはさらに構築され、訓練され、異なる複雑さの制約の下で自動的に検出器のファミリーを取得する。
一般的なベンチマークであるWIDER FaceとFDDBで実施された大規模な実験は、提案された自動かつスケーラブルな顔検出器(ASFD)ファミリーの最先端の性能と効率のトレードオフを実証している。
特に、当社の強力な ASFD-D6 は、WIDER Face テストで AP 96.7/96.2/92.1 よりも優れており、軽量の ASFD-D0 は約3.1 ms、VGA解像度の画像を持つ V100 GPU では 320 FPS 以上である。
関連論文リスト
- Towards Data-Centric Face Anti-Spoofing: Improving Cross-domain Generalization via Physics-based Data Synthesis [64.46312434121455]
Face Anti-Spoofing (FAS) 研究は、トレーニングデータとテストデータの間にドメインギャップがあるクロスドメイン問題によって難題となっている。
本研究では,タスク固有のFASデータ拡張(FAS-Aug)を提案する。
また,特定の種類のアーティファクトをモデルが依存しないようにし,一般化性能を向上させるために,SARE(Spowing Attack Risk Equalization)を提案する。
論文 参考訳(メタデータ) (2024-09-04T01:45:18Z) - Efficient Facial Landmark Detection for Embedded Systems [1.0878040851638]
本稿では、電力消費と時間遅延に関する課題に直面するエッジデバイス向けに特別に設計された、効率的な顔画像位置検出(EFLD)モデルを提案する。
EFLDは軽量のバックボーンとフレキシブルな検出ヘッドを備えており、それぞれがリソース制約されたデバイスの運用効率を大幅に向上する。
予測コストを増大させることなく,モデルの一般化性と堅牢性を高めるためのクロスフォーマットトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-07-14T14:49:20Z) - FMM-X3D: FPGA-based modeling and mapping of X3D for Human Action
Recognition [10.385864925381384]
本稿では,人間行動認識の最先端モデルであるX3DをFPGAデバイスにマッピングする問題に対処する。
提案するツールフローは,FPGAデバイスの利用可能なリソースとオフチップメモリ特性を考慮した最適化ストリームベースハードウェアシステムを生成する。
論文 参考訳(メタデータ) (2023-05-29T11:17:51Z) - EResFD: Rediscovery of the Effectiveness of Standard Convolution for
Lightweight Face Detection [13.357235715178584]
顔検出のための軽量バックボーンアーキテクチャとして,標準的な畳み込みブロックの有効性を再検討する。
チャネル切断された標準畳み込み層は精度と推論速度を向上できることを示す。
提案する検出器EResFDは,CPU上でのVGA画像推測に37.7msしか要しないWIDER FACE Hardサブセット上で80.4%のmAPを得た。
論文 参考訳(メタデータ) (2022-04-04T02:30:43Z) - A Synthesis-Based Approach for Thermal-to-Visible Face Verification [105.63410428506536]
本稿では,ARL-VTFおよびTUFTSマルチスペクトル顔データセット上での最先端性能を実現するアルゴリズムを提案する。
MILAB-VTF(B)も提案する。
論文 参考訳(メタデータ) (2021-08-21T17:59:56Z) - Face Anti-Spoofing with Human Material Perception [76.4844593082362]
フェース・アンチ・スプーフィング(FAS)は、プレゼンテーション攻撃から顔認識システムを保護する上で重要な役割を担っている。
我々は、顔の反偽造を物質認識問題として言い換え、それを古典的な人間の物質知覚と組み合わせる。
本稿では,本質的な素材に基づくパターンをキャプチャ可能なバイラテラル畳み込みネットワーク(BCN)を提案する。
論文 参考訳(メタデータ) (2020-07-04T18:25:53Z) - ACFD: Asymmetric Cartoon Face Detector [72.60983975604145]
ACFDは2020年のiCartoon Face Challengeで1位を獲得した。
ACFDは、モデルサイズ200MB、画像あたりの推測時間50ms、事前訓練されたモデルなしで、2020年のiCartoon Face Challengeの1位を獲得しました。
論文 参考訳(メタデータ) (2020-07-02T05:57:34Z) - ASFD: Automatic and Scalable Face Detector [129.82350993748258]
ASFD(Automatic and Scalable Face Detector)を提案する。
ASFDはニューラルアーキテクチャ検索技術の組み合わせと新たな損失設計に基づいている。
ASFD-D0は120FPS以上で動作し、MobilenetはVGA解像度の画像を撮影しています。
論文 参考訳(メタデータ) (2020-03-25T06:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。