論文の概要: A Lightweight and Accurate Face Detection Algorithm Based on Retinaface
- arxiv url: http://arxiv.org/abs/2308.04340v1
- Date: Tue, 8 Aug 2023 15:36:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-09 12:15:27.767264
- Title: A Lightweight and Accurate Face Detection Algorithm Based on Retinaface
- Title(参考訳): 網膜面に基づく軽量かつ高精度な顔検出アルゴリズム
- Authors: Baozhu Liu, Hewei Yu
- Abstract要約: Retinaface に基づく軽量かつ高精度な顔検出アルゴリズム LAFD (Light and accurate face detection) を提案する。
アルゴリズムのバックボーンネットワークは、畳み込みカーネルのサイズを調整する修正されたMobileNetV3ネットワークである。
入力画像が前処理され、長さが1560px、幅が1200pxとなると、平均精度は86.2%となる。
- 参考スコア(独自算出の注目度): 0.5076419064097734
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a lightweight and accurate face detection algorithm
LAFD (Light and accurate face detection) based on Retinaface. Backbone network
in the algorithm is a modified MobileNetV3 network which adjusts the size of
the convolution kernel, the channel expansion multiplier of the inverted
residuals block and the use of the SE attention mechanism. Deformable
convolution network(DCN) is introduced in the context module and the algorithm
uses focal loss function instead of cross-entropy loss function as the
classification loss function of the model. The test results on the WIDERFACE
dataset indicate that the average accuracy of LAFD is 94.1%, 92.2% and 82.1%
for the "easy", "medium" and "hard" validation subsets respectively with an
improvement of 3.4%, 4.0% and 8.3% compared to Retinaface and 3.1%, 4.1% and
4.1% higher than the well-performing lightweight model, LFFD. If the input
image is pre-processed and scaled to 1560px in length or 1200px in width, the
model achieves an average accuracy of 86.2% on the 'hard' validation subset.
The model is lightweight, with a size of only 10.2MB.
- Abstract(参考訳): 本稿では,Retinaface を用いた軽量かつ高精度な顔検出アルゴリズム LAFD (Light and accurate face detection) を提案する。
アルゴリズムのバックボーンネットワークは、畳み込みカーネルのサイズ、反転残差ブロックのチャネル拡大乗算器、seアテンション機構の使用を調整する改良されたmobilenetv3ネットワークである。
変形可能な畳み込みネットワーク(dcn)がコンテキストモジュールに導入され、アルゴリズムはモデルの分類損失関数としてクロスエントロピー損失関数の代わりに焦点損失関数を使用する。
WIDERFACEデータセットの試験結果は、LAFDの平均精度が94.1%、92.2%、82.1%で、それぞれ3.4%、4.0%、および8.3%の改善であり、優れた軽量モデルであるLFFDよりも3.1%、4.1%高い。
入力画像が前処理され、長さ1560px、幅1200pxにスケールされた場合、「ハード」検証サブセットの平均精度は86.2%となる。
モデルは軽量で、サイズは10.2MBである。
関連論文リスト
- An Enhancement of Haar Cascade Algorithm Applied to Face Recognition for Gate Pass Security [0.0]
顔認識ライブラリはHaar Cascade Algorithmで実装された。
グレースケール画像をRGBに変換し、顔符号化を改善するためにサブプロセスを適用した。
拡張ハールカスケードアルゴリズムは98.39%の精度を実現した。
論文 参考訳(メタデータ) (2024-11-06T11:03:34Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - One-Shot Learning for Periocular Recognition: Exploring the Effect of
Domain Adaptation and Data Bias on Deep Representations [59.17685450892182]
広範に使用されているCNNモデルにおける深部表現の挙動をワンショット近視認識のための極端データ不足下で検討する。
我々は、バイオメトリックデータセットで訓練されたネットワークを数百万の画像で活用し、最先端の結果を改善した。
SIFTのような従来のアルゴリズムは、限られたデータでCNNより優れている。
論文 参考訳(メタデータ) (2023-07-11T09:10:16Z) - Patch-Level Contrasting without Patch Correspondence for Accurate and
Dense Contrastive Representation Learning [79.43940012723539]
ADCLRは、正確で高密度な視覚表現を学習するための自己教師型学習フレームワークである。
提案手法は, コントラッシブな手法のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-23T07:38:09Z) - Pushing the Limits of Fewshot Anomaly Detection in Industry Vision:
Graphcore [71.09522172098733]
FSADにおけるグラフ表現を利用して,新しい視覚不変特徴(VIIF)を異常測定特徴として利用する。
VIIFは異常識別能力を確実に向上し、Mに格納された冗長な特徴のサイズをさらに小さくすることができる。
さらに、教師なしFSADトレーニングを高速に実装し、異常検出の性能を向上させることができる、VIIFによる新しいモデルGraphCoreを提供する。
論文 参考訳(メタデータ) (2023-01-28T03:58:32Z) - Network Compression via Central Filter [9.585818883354449]
本稿では,フィルタの適切な調整後に,フィルタが他のフィルタの集合とほぼ等しいことを示唆する,新しいフィルタプルーニング手法であるCentral Filter (CF)を提案する。
CFは様々なベンチマークネットワークやデータセットで最先端のパフォーマンスを得る。
論文 参考訳(メタデータ) (2021-12-10T12:51:04Z) - Robust Segmentation Models using an Uncertainty Slice Sampling Based
Annotation Workflow [5.051373749267151]
本稿では,3次元医療ボリュームのセマンティックセグメンテーションのための不確実スライスサンプリング(USS)戦略を提案する。
多地点データを用いた肝セグメンテーション作業におけるUSSの有効性を示す。
論文 参考訳(メタデータ) (2021-09-30T06:56:11Z) - Small Object Detection Based on Modified FSSD and Model Compression [7.387639662781843]
本稿では,FSSDに基づく小型物体検出アルゴリズムを提案する。
計算コストと記憶空間を削減するため, モデル圧縮を実現するためにプルーニングを行う。
アルゴリズムの平均精度(mAP)は、PASCAL VOCで80.4%、GTX1080tiで59.5 FPSに達する。
論文 参考訳(メタデータ) (2021-08-24T03:20:32Z) - Research on Optimization Method of Multi-scale Fish Target Fast
Detection Network [11.99307231512725]
2000枚の魚画像でネットワークをテストする精度は94.37%に達し、BFLOPSの計算複雑性はわずか5.47である。
その結果, BTP-Yolov3はモデルパラメータが小さく, 計算速度が速く, 運転時のエネルギー消費量も小さいことがわかった。
論文 参考訳(メタデータ) (2021-04-11T16:53:34Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。