論文の概要: An Improved Lightweight YOLOv5 Model Based on Attention Mechanism for
Face Mask Detection
- arxiv url: http://arxiv.org/abs/2203.16506v1
- Date: Wed, 30 Mar 2022 17:41:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 14:26:01.024646
- Title: An Improved Lightweight YOLOv5 Model Based on Attention Mechanism for
Face Mask Detection
- Title(参考訳): マスク検出のための注意機構に基づく軽量YOLOv5モデルの改良
- Authors: Sheng Xu
- Abstract要約: YOLOv5に基づく軽量マスク検出器を提案する。
平均精度は95.2%で、ベースラインよりも4.4%高く、既存のモデルよりも正確である。
- 参考スコア(独自算出の注目度): 3.3398969693904723
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Coronavirus 2019 has brought severe challenges to social stability and public
health worldwide. One effective way of curbing the epidemic is to require
people to wear masks in public places and monitor mask-wearing states by
utilizing suitable automatic detectors. However, existing deep learning based
models struggle to simultaneously achieve the requirements of both high
precision and real-time performance. To solve this problem, we propose an
improved lightweight face mask detector based on YOLOv5, which can achieve an
excellent balance of precision and speed. Firstly, a novel backbone
ShuffleCANet that combines ShuffleNetV2 network with Coordinate Attention
mechanism is proposed as the backbone. Then we use BiFPN as the feature fusion
neck. Furthermore, we replace the loss function of localization with -CIoU to
obtain higher-quality anchors. Some valuable strategies such as data
augmentation, adaptive image scaling, and anchor cluster operation are also
utilized. Experimental results show the performance and effectiveness of the
proposed model. On the basis of the original YOLOv5 model, our work increases
the inference speed by 28.3% while still improving the precision by 0.58% on
the AIZOO face mask dataset. It achieves a mean average precision of 95.2%,
which is 4.4% higher than the baseline and is also more accurate compared with
other existing models.
- Abstract(参考訳): 2019年は世界的な社会安定と公衆衛生に深刻な課題をもたらした。
流行を抑える効果的な方法の1つは、公共の場でマスクを着用し、適切な自動検知器を利用することでマスク着用状態を監視することである。
しかし、既存のディープラーニングベースのモデルは、高精度とリアルタイムの両方のパフォーマンスの要求を同時に達成するのに苦労している。
そこで本稿では,yolov5に基づく軽量面マスク検出装置を提案し,精度と速度のバランスを良好に両立させる。
まず、shufflenetv2ネットワークと座標注意機構を組み合わせた新しいバックボーンshufflecanetがバックボーンとして提案されている。
次に、機能融合ネックとしてBiFPNを使用します。
さらに,ローカライゼーションの損失関数をciouに置き換え,高品質アンカーを得る。
データ拡張、適応的なイメージスケーリング、アンカークラスタ操作といった重要な戦略も活用されている。
実験結果は,提案モデルの性能と有効性を示す。
元のYOLOv5モデルに基づいて、我々の研究は推論速度を28.3%向上させながら、AIZOOフェイスマスクデータセットの精度を0.58%向上させた。
平均精度は95.2%であり、これはベースラインよりも4.4%高く、他のモデルよりも正確である。
関連論文リスト
- Robust Fine-tuning of Zero-shot Models via Variance Reduction [56.360865951192324]
微調整ゼロショットモデルの場合、このデシドラトゥムは細調整モデルで、分布内(ID)と分布外(OOD)の両方で優れる。
トレードオフを伴わずに最適なIDとOODの精度を同時に達成できるサンプルワイズアンサンブル手法を提案する。
論文 参考訳(メタデータ) (2024-11-11T13:13:39Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - A Review and Implementation of Object Detection Models and Optimizations for Real-time Medical Mask Detection during the COVID-19 Pandemic [0.0]
この研究は、Common Objects in Context(COCO)データセット上で最も基本的なオブジェクト検出モデルを評価する。
我々は、医療マスクを用いた人間の顔の話題的、未探索のデータセットをトレーニングするために、YOLOv5と呼ばれる非常に効率的なモデルを選択した。
医療用マスクの正確な検出に移動学習を用いたYOLOv5に基づく最適化モデルを提案する。
論文 参考訳(メタデータ) (2024-05-28T17:27:24Z) - Mask wearing object detection algorithm based on improved YOLOv5 [6.129833920546161]
本稿では, YOLOv5lに基づくマスク着用顔検出モデルを提案する。
提案手法はマスク着用の検出能力を大幅に向上させる。
論文 参考訳(メタデータ) (2023-10-16T10:06:42Z) - EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。
我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。
私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文 参考訳(メタデータ) (2023-02-15T06:05:14Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - Real-Time Mask Detection Based on SSD-MobileNetV2 [2.538209532048867]
優れたリアルタイムマスク検出システムにより、関連するスタッフの作業負荷を低減できる。
既存のマスク検出手法は資源集約的であり、速度と精度のバランスが良くない。
本稿では,マスク検出のための新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-08-29T01:59:22Z) - Research on Mask Wearing Detection of Natural Population Based on
Improved YOLOv4 [0.0]
本稿では,改良型YOLOv4に基づくマスク着用検出手法を提案する。
機能の融合と表現を調整するために、バックボーンにコーディネートアテンションモジュールを追加します。
第3に、K平均クラスタリングアルゴリズムをデプロイし、NPMDデータセットに9つのアンカーボックスをより適させる。
論文 参考訳(メタデータ) (2022-08-24T08:04:11Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices [13.62426382827205]
実時間物体検出器のPP-PicoDetファミリは,モバイルデバイスの物体検出において優れた性能を発揮する。
モデルは、他の一般的なモデルと比較して、精度とレイテンシのトレードオフを改善する。
論文 参考訳(メタデータ) (2021-11-01T12:53:17Z) - BinaryCoP: Binary Neural Network-based COVID-19 Face-Mask Wear and
Positioning Predictor on Edge Devices [63.56630165340053]
フェイスマスクは、空気性疾患に対する双方向保護のための医療に効果的な解決策を提供する。
CNNは、顔認識と正しいマスク着用と位置決めの分類に優れたソリューションを提供する。
CNNは、企業ビル、空港、ショッピングエリア、その他の屋内場所への入り口で利用でき、ウイルスの拡散を緩和することができる。
論文 参考訳(メタデータ) (2021-02-06T00:14:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。