論文の概要: YOLO-FaceV2: A Scale and Occlusion Aware Face Detector
- arxiv url: http://arxiv.org/abs/2208.02019v2
- Date: Thu, 4 Aug 2022 16:29:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-05 10:25:53.715966
- Title: YOLO-FaceV2: A Scale and Occlusion Aware Face Detector
- Title(参考訳): YOLO-FaceV2: スケールとオクルージョンを意識した顔検出装置
- Authors: Ziping Yu, Hongbo Huang, Weijun Chen, Yongxin Su, Yahui Liu, Xiuying
Wang
- Abstract要約: 本稿では, YOLO-FaceV2 という一段検出器 YOLOv5 に基づくリアルタイム顔検出器を提案する。
我々は、RFEと呼ばれる受容野拡張モジュールを用いて、小さな顔の受容野を高め、小さな物体の位置ずれに対するIoUの感度を補うためにNWD Lossを使用する。
顔検出器はYOLOより優れており、その変異は、簡単で中堅なサブセットで見つけることができる。
- 参考スコア(独自算出の注目度): 3.632920443532506
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, face detection algorithms based on deep learning have made
great progress. These algorithms can be generally divided into two categories,
i.e. two-stage detector like Faster R-CNN and one-stage detector like YOLO.
Because of the better balance between accuracy and speed, one-stage detectors
have been widely used in many applications. In this paper, we propose a
real-time face detector based on the one-stage detector YOLOv5, named
YOLO-FaceV2. We design a Receptive Field Enhancement module called RFE to
enhance receptive field of small face, and use NWD Loss to make up for the
sensitivity of IoU to the location deviation of tiny objects. For face
occlusion, we present an attention module named SEAM and introduce Repulsion
Loss to solve it. Moreover, we use a weight function Slide to solve the
imbalance between easy and hard samples and use the information of the
effective receptive field to design the anchor. The experimental results on
WiderFace dataset show that our face detector outperforms YOLO and its variants
can be find in all easy, medium and hard subsets. Source code in
https://github.com/Krasjet-Yu/YOLO-FaceV2
- Abstract(参考訳): 近年,ディープラーニングに基づく顔検出アルゴリズムが大きな進歩を遂げている。
これらのアルゴリズムは一般的に、Faster R-CNNのような2段階検出器とYOLOのような1段階検出器という2つのカテゴリに分けられる。
精度と速度のバランスが良いため、1段検出器は多くの用途で広く使われている。
本稿では, YOLO-FaceV2 という一段検出器 YOLOv5 を用いたリアルタイム顔検出器を提案する。
我々は,小顔の受容野を強化するためにrfeと呼ばれる受容野強化モジュールを設計し,nwd損失を用いて小物体の位置偏差に対するiouの感度を補う。
顔閉塞にはSEAMというアテンションモジュールを導入し,それを解決するためにRepulsion Lossを導入する。
さらに, 重み関数スライドを用いて, 簡単な試料と難しい試料間の不均衡を解消し, 効果的な受容場の情報を用いてアンカーの設計を行う。
WiderFaceデータセットの実験結果によると、顔検出器はYOLOよりも優れており、その変異は、簡単で中堅なサブセットすべてで見つけることができる。
https://github.com/Krasjet-Yu/YOLO-FaceV2のソースコード。
関連論文リスト
- Effective and Efficient Adversarial Detection for Vision-Language Models via A Single Vector [97.92369017531038]
Diverse hArmful Responses (RADAR) を用いた新しい laRge-scale Adervsarial 画像データセットを構築した。
そこで我々は,視覚言語モデル (VLM) の隠れ状態から抽出した1つのベクトルを利用して,入力中の良質な画像に対して対向画像を検出する,新しいiN時間埋め込み型AdveRSarial Image Detectction (NEARSIDE) 法を開発した。
論文 参考訳(メタデータ) (2024-10-30T10:33:10Z) - Simplifying Two-Stage Detectors for On-Device Inference in Remote Sensing [0.7305342793164903]
本研究では,2段階物体検出器のモデル簡易化手法を提案する。
本手法は,DOTAv1.5データセットの2.1%以内の精度で計算コストを61.2%まで削減する。
論文 参考訳(メタデータ) (2024-04-11T00:45:10Z) - YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time
Object Detection [80.11152626362109]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。
私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。
私たちの仕事は、他のYOLOモデルのプラグイン・アンド・プレイ・モジュールとしても使えます。
論文 参考訳(メタデータ) (2023-08-10T10:12:27Z) - Towards End-to-end Semi-supervised Learning for One-stage Object
Detection [88.56917845580594]
本稿では,高度な一段検出ネットワークYOLOv5の半教師付き学習に焦点を当てた。
そこで我々は,Multi-view Pseudo-label Refinement (MPR) とDecoupled Semi-supervised Optimization (DSO) の2つの革新的な設計を取り入れた新しい教師学習レシピOneTeacherを提案する。
特に、MPRは、拡張ビューリファインメントとグローバルビューフィルタリングによって擬似ラベルの品質を改善し、DSOは構造的な微調整とタスク固有の擬似ラベルによる共同最適化競合を処理する。
論文 参考訳(メタデータ) (2023-02-22T11:35:40Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - Embracing Single Stride 3D Object Detector with Sparse Transformer [63.179720817019096]
自律走行のためのLiDARを用いた3次元物体検出では、物体サイズと入力シーンサイズとの比が2次元検出の場合に比べて有意に小さい。
多くの3D検出器は2D検出器の一般的な慣習に従っており、点雲の定量化後も特徴マップを分解する。
本稿では,SST(Single-stride Sparse Transformer)を提案する。
論文 参考訳(メタデータ) (2021-12-13T02:12:02Z) - YOLO5Face: Why Reinventing a Face Detector [1.3272510644778104]
我々は、YOLOv5オブジェクト検出器をベースとした顔検出器を実装し、YOLO5Faceと呼ぶ。
モデルサイズが異なる検出器を設計し、最高の性能を実現する。
WiderFaceデータセットの実験結果は、私たちの顔検出器が最先端の性能を達成できることを示している。
論文 参考訳(メタデータ) (2021-05-27T03:54:38Z) - MogFace: Rethinking Scale Augmentation on the Face Detector [17.570686622370403]
本研究では,画像の前景情報と後景情報とスケール情報を含む先行ソリューションの違いについて検討する。
本稿では,これらの2つの情報を効率的に同時に同化できるSSE戦略を提案する。
本手法は,すべての顔検出ベンチマークにおける最先端検出性能を実現する。
論文 参考訳(メタデータ) (2021-03-20T09:17:04Z) - Long-distance tiny face detection based on enhanced YOLOv3 for unmanned
system [10.856903504701712]
無人プラットフォームのためのYOLOv3アルゴリズムに基づく拡張型ネットワークモデル(YOLOv3-C)を提案する。
拡張モデルにより,長距離群集や高密度群集の場合の顔検出精度が向上する。
論文 参考訳(メタデータ) (2020-10-09T08:12:58Z) - Deep Spatial Gradient and Temporal Depth Learning for Face Anti-spoofing [61.82466976737915]
深層学習は、顔の反偽造の最も効果的な方法の1つとして証明されている。
2つの洞察に基づいて,複数フレームからの提示攻撃を検出する新しい手法を提案する。
提案手法は,5つのベンチマークデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2020-03-18T06:11:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。