論文の概要: A Review and Implementation of Object Detection Models and Optimizations for Real-time Medical Mask Detection during the COVID-19 Pandemic
- arxiv url: http://arxiv.org/abs/2405.18387v1
- Date: Tue, 28 May 2024 17:27:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 17:20:57.792194
- Title: A Review and Implementation of Object Detection Models and Optimizations for Real-time Medical Mask Detection during the COVID-19 Pandemic
- Title(参考訳): COVID-19パンデミック時のリアルタイムマスク検出のためのオブジェクト検出モデルと最適化のレビューと実装
- Authors: Ioanna Gogou, Dimitrios Koutsomitropoulos,
- Abstract要約: この研究は、Common Objects in Context(COCO)データセット上で最も基本的なオブジェクト検出モデルを評価する。
我々は、医療マスクを用いた人間の顔の話題的、未探索のデータセットをトレーニングするために、YOLOv5と呼ばれる非常に効率的なモデルを選択した。
医療用マスクの正確な検出に移動学習を用いたYOLOv5に基づく最適化モデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolutional Neural Networks (CNN) are commonly used for the problem of object detection thanks to their increased accuracy. Nevertheless, the performance of CNN-based detection models is ambiguous when detection speed is considered. To the best of our knowledge, there has not been sufficient evaluation of the available methods in terms of the speed/accuracy trade-off in related literature. This work assesses the most fundamental object detection models on the Common Objects in Context (COCO) dataset with respect to this trade-off, their memory consumption, and computational and storage cost. Next, we select a highly efficient model called YOLOv5 to train on the topical and unexplored dataset of human faces with medical masks, the Properly-Wearing Masked Faces Dataset (PWMFD), and analyze the benefits of specific optimization techniques for real-time medical mask detection: transfer learning, data augmentations, and a Squeeze-and-Excitation attention mechanism. Using our findings in the context of the COVID-19 pandemic, we propose an optimized model based on YOLOv5s using transfer learning for the detection of correctly and incorrectly worn medical masks that surpassed more than two times in speed (69 frames per second) the state-of-the-art model SE-YOLOv3 on the PWMFD dataset while maintaining the same level of mean Average Precision (67%).
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は、その精度の向上により、オブジェクト検出の問題に一般的に使用される。
しかし,検出速度を考慮した場合,CNNに基づく検出モデルの性能は不明瞭である。
我々の知る限り、関連文献の速度/精度トレードオフの観点からは、利用可能な方法の十分な評価が得られていない。
この研究は、このトレードオフ、メモリ消費、計算とストレージコストに関して、Common Objects in Context(COCO)データセット上の最も基本的なオブジェクト検出モデルを評価する。
次に,医療マスクを用いた人物顔の話題的・未探索データセットのトレーニング,PWMFD(Properly-Wearing Masked Faces Dataset),およびリアルタイム医療マスク検出のための特定の最適化手法の利点を分析するために,YOLOv5と呼ばれる高効率モデルを選択した。
COVID-19パンデミックの文脈で得られた知見を用いて, 平均精度(67%)を維持しつつ, PWMFDデータセット上の2倍以上の速度(69フレーム/秒)を超える医療マスクの検出に, 転送学習を用いたYOLOv5sに基づく最適化モデルを提案する。
関連論文リスト
- Mask wearing object detection algorithm based on improved YOLOv5 [6.129833920546161]
本稿では, YOLOv5lに基づくマスク着用顔検出モデルを提案する。
提案手法はマスク着用の検出能力を大幅に向上させる。
論文 参考訳(メタデータ) (2023-10-16T10:06:42Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Unleashing Mask: Explore the Intrinsic Out-of-Distribution Detection
Capability [70.72426887518517]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイする際に、セキュアAIの必須の側面である。
本稿では,IDデータを用いた学習モデルのOOD識別能力を復元する新しい手法であるUnleashing Maskを提案する。
本手法では, マスクを用いて記憶した非定型サンプルを抽出し, モデルを微調整するか, 導入したマスクでプルーする。
論文 参考訳(メタデータ) (2023-06-06T14:23:34Z) - CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion
Models [72.93652777646233]
カモフラーゲ型物体検出(COD)は、カモフラーゲ型物体とその周囲の類似性が高いため、コンピュータビジョンにおいて難しい課題である。
本研究では,CODを拡散モデルを利用した条件付きマスク生成タスクとして扱う新しいパラダイムを提案する。
カモ拡散(CamoDiffusion)と呼ばれる本手法では,拡散モデルのデノナイズプロセスを用いてマスクの雑音を反復的に低減する。
論文 参考訳(メタデータ) (2023-05-29T07:49:44Z) - Wearing face mask detection using deep learning through COVID-19
pandemic [0.0]
本稿では,3つの最先端物体検出ニューラルネットワークによる顔マスク検出のリアルタイム応用の可能性について検討する。
異なるモデルの性能によると、現実世界やモバイルデバイスでの使用に適した最良のモデルは、YOLOv4-tinyモデルである。
論文 参考訳(メタデータ) (2023-04-28T19:39:32Z) - PACMAN: a framework for pulse oximeter digit detection and reading in a
low-resource setting [0.42897826548373363]
新型コロナウイルスのパンデミックを受けて、患者は毎日の酸素飽和度(SpO2)とパルスレート(PR)値を健康モニタリングシステムに手動で入力する必要がある。
光文字認識(OCR)を用いた捕獲画像からの生理的価値の検出の試み
本研究の目的は,低リソース深層学習型コンピュータビジョンを用いたPACMANという新しいフレームワークを提案することである。
論文 参考訳(メタデータ) (2022-12-09T16:22:28Z) - Real-Time Mask Detection Based on SSD-MobileNetV2 [2.538209532048867]
優れたリアルタイムマスク検出システムにより、関連するスタッフの作業負荷を低減できる。
既存のマスク検出手法は資源集約的であり、速度と精度のバランスが良くない。
本稿では,マスク検出のための新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-08-29T01:59:22Z) - An Improved Lightweight YOLOv5 Model Based on Attention Mechanism for
Face Mask Detection [3.3398969693904723]
YOLOv5に基づく軽量マスク検出器を提案する。
平均精度は95.2%で、ベースラインよりも4.4%高く、既存のモデルよりも正確である。
論文 参考訳(メタデータ) (2022-03-30T17:41:21Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。