論文の概要: The Impact of Image Resolution on Face Detection: A Comparative Analysis of MTCNN, YOLOv XI and YOLOv XII models
- arxiv url: http://arxiv.org/abs/2507.23341v1
- Date: Thu, 31 Jul 2025 08:41:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:09.325845
- Title: The Impact of Image Resolution on Face Detection: A Comparative Analysis of MTCNN, YOLOv XI and YOLOv XII models
- Title(参考訳): 顔検出における画像解像度の影響:MTCNN, YOLOv XI, YOLOv XIIモデルの比較分析
- Authors: Ahmet Can Ömercikoğlu, Mustafa Mansur Yönügül, Pakize Erdoğmuş,
- Abstract要約: 入力解像度が3つの深層学習に基づく顔検出装置(YOLOv11, YOLOv12, MTCNN)の精度と堅牢性に及ぼす影響を系統的に検討した。
その結果, YOLOv11 は YOLOv12 と MTCNN よりも高い精度, 特に高分解能で優れていた。
本研究は、様々な操作制約に適合する解像度認識顔検出モデルを選択するための実用的な洞察を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Face detection is a crucial component in many AI-driven applications such as surveillance, biometric authentication, and human-computer interaction. However, real-world conditions like low-resolution imagery present significant challenges that degrade detection performance. In this study, we systematically investigate the impact of input resolution on the accuracy and robustness of three prominent deep learning-based face detectors: YOLOv11, YOLOv12, and MTCNN. Using the WIDER FACE dataset, we conduct extensive evaluations across multiple image resolutions (160x160, 320x320, and 640x640) and assess each model's performance using metrics such as precision, recall, mAP50, mAP50-95, and inference time. Results indicate that YOLOv11 outperforms YOLOv12 and MTCNN in terms of detection accuracy, especially at higher resolutions, while YOLOv12 exhibits slightly better recall. MTCNN, although competitive in landmark localization, lags in real-time inference speed. Our findings provide actionable insights for selecting resolution-aware face detection models suitable for varying operational constraints.
- Abstract(参考訳): 顔検出は、監視、生体認証、人間とコンピュータのインタラクションなど、AI駆動の多くのアプリケーションにおいて重要なコンポーネントである。
しかし、低解像度画像のような現実世界の条件は、検出性能を低下させる重要な課題である。
本研究では,入力解像度が3つの深層学習に基づく顔検出装置(YOLOv11, YOLOv12, MTCNN)の精度と堅牢性に及ぼす影響を系統的に検討した。
WIDER FACEデータセットを用いて、複数の画像解像度(160x160, 320x320, 640x640)にわたって広範囲な評価を行い、精度、リコール、mAP50, mAP50-95、推測時間などの指標を用いて各モデルの性能を評価する。
その結果, YOLOv11 は YOLOv12 と MTCNN よりも高い精度, 特に高解像度では YOLOv12 よりも優れており, YOLOv12 は若干良好なリコールを示すことがわかった。
MTCNNはランドマークのローカライゼーションでは競合するが、リアルタイムの推論速度は遅れている。
本研究は、様々な操作制約に適合する解像度認識顔検出モデルを選択するための実用的な洞察を提供する。
関連論文リスト
- Small Object Detection with YOLO: A Performance Analysis Across Model Versions and Hardware [2.07180164747172]
本稿では,ONNX や OpenVINO などの人気ライブラリを用いて,Intel と CPU の高速化と検出精度について検討する。
画像内のオブジェクトサイズに対するこれらのYOLOモデルの感度を分析し、画像の総面積の1%、2.5%、5%を占めるオブジェクトを検出する際の性能を調べる。
論文 参考訳(メタデータ) (2025-04-14T05:49:31Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - YOLO Evolution: A Comprehensive Benchmark and Architectural Review of YOLOv12, YOLO11, and Their Previous Versions [0.0]
本研究は, YOLOv3から最新のYOLOv12への包括的実験評価である。
考慮すべき課題は、さまざまなオブジェクトサイズ、多様なアスペクト比、単一クラスの小さなオブジェクトである。
分析では各YOLOバージョンの特徴的長所と短所を強調した。
論文 参考訳(メタデータ) (2024-10-31T20:45:00Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - A Review and Implementation of Object Detection Models and Optimizations for Real-time Medical Mask Detection during the COVID-19 Pandemic [0.0]
この研究は、Common Objects in Context(COCO)データセット上で最も基本的なオブジェクト検出モデルを評価する。
我々は、医療マスクを用いた人間の顔の話題的、未探索のデータセットをトレーニングするために、YOLOv5と呼ばれる非常に効率的なモデルを選択した。
医療用マスクの正確な検出に移動学習を用いたYOLOv5に基づく最適化モデルを提案する。
論文 参考訳(メタデータ) (2024-05-28T17:27:24Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。