論文の概要: Effectiveness of Detection-based and Regression-based Approaches for
Estimating Mask-Wearing Ratio
- arxiv url: http://arxiv.org/abs/2111.12888v1
- Date: Thu, 25 Nov 2021 03:32:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-29 15:30:18.075397
- Title: Effectiveness of Detection-based and Regression-based Approaches for
Estimating Mask-Wearing Ratio
- Title(参考訳): マスク着用率推定における検出ベースおよび回帰型アプローチの有効性
- Authors: Khanh-Duy Nguyen, Huy H. Nguyen, Trung-Nghia Le, Junichi Yamagishi,
Isao Echizen
- Abstract要約: 保健当局が政策を迅速に分析し実施できるようにするため、公共の場でマスク着用率を推定することが重要である。
本稿では,検出に基づく手法と回帰に基づく手法を併用した2つの比推定手法を提案する。
我々はまた、17のストリートビュービデオ18,088フレームから抽出された581,108の顔アノテーションを含む最初の大規模データセットであるNFMデータセットを提示する。
- 参考スコア(独自算出の注目度): 46.377391632446624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating the mask-wearing ratio in public places is important as it enables
health authorities to promptly analyze and implement policies. Methods for
estimating the mask-wearing ratio on the basis of image analysis have been
reported. However, there is still a lack of comprehensive research on both
methodologies and datasets. Most recent reports straightforwardly propose
estimating the ratio by applying conventional object detection and
classification methods. It is feasible to use regression-based approaches to
estimate the number of people wearing masks, especially for congested scenes
with tiny and occluded faces, but this has not been well studied. A large-scale
and well-annotated dataset is still in demand. In this paper, we present two
methods for ratio estimation that leverage either a detection-based or
regression-based approach. For the detection-based approach, we improved the
state-of-the-art face detector, RetinaFace, used to estimate the ratio. For the
regression-based approach, we fine-tuned the baseline network, CSRNet, used to
estimate the density maps for masked and unmasked faces. We also present the
first large-scale dataset, the ``NFM dataset,'' which contains 581,108 face
annotations extracted from 18,088 video frames in 17 street-view videos.
Experiments demonstrated that the RetinaFace-based method has higher accuracy
under various situations and that the CSRNet-based method has a shorter
operation time thanks to its compactness.
- Abstract(参考訳): 公衆の場でマスク着用率を推定することは、保健当局が迅速に政策の分析と実施を可能にするため重要である。
マスク着用率を画像解析に基づいて推定する方法が報告されている。
しかしながら、方法論とデータセットの両方に関する包括的な研究は、まだ不足している。
最近の報告では,従来の対象検出法と分類法を用いて,その比率を推定することを提案する。
マスクを着用している人の数を推定するために回帰に基づくアプローチを用いることが可能であるが、特に小型で隠蔽された顔を持つ密集した場面ではよく研究されていない。
大規模で十分な注釈付きデータセットはまだ需要がある。
本稿では,検出に基づく手法と回帰に基づく手法を併用した2つの比推定手法を提案する。
検出に基づくアプローチでは,その比率を推定するために,最先端の顔検出器であるRetinaFaceを改良した。
回帰に基づくアプローチでは,マスクやマスクのない顔の密度マップを推定するために,ベースラインネットワークであるCSRNetを微調整した。
また、17のストリートビュービデオで18,088フレームから抽出された581,108の顔アノテーションを含む,最初の大規模データセットである `NFM dataset' も提示する。
実験により, RetinaFace法は様々な状況下で高い精度を示し, CSRNet法は小型化により動作時間が短縮された。
関連論文リスト
- Masked Gamma-SSL: Learning Uncertainty Estimation via Masked Image
Modeling [19.000718685399935]
本研究では,単一の前方通過で高品質な不確実性推定を行うセマンティックセグメンテーションネットワークを提案する。
我々は、Masked Image Modeling (MIM) アプローチにより、基礎モデルと非ラベルデータセットの一般的な表現を利用する。
安全クリティカルなアプリケーションで使用されるニューラルネットワークでは、トレーニングデータのバイアスがエラーにつながる可能性がある。
論文 参考訳(メタデータ) (2024-02-27T15:49:54Z) - ReMasker: Imputing Tabular Data with Masked Autoencoding [16.309069766467072]
ReMaskerは、マスク付き自動符号化フレームワークを拡張して、表形式のデータに欠落した値を出力する新しい方法である。
ReMaskerは、計算精度と実用性の両方の観点から最先端の手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2023-09-25T01:03:45Z) - Calibrating the Rigged Lottery: Making All Tickets Reliable [14.353428281239665]
信頼性校正を改善したスパースモデルを生成するための新しいスパーストレーニング手法を提案する。
本手法は,計算量や記憶負荷をわずかに増加させるだけで,同時に精度を向上する。
論文 参考訳(メタデータ) (2023-02-18T15:53:55Z) - Direct Dense Pose Estimation [138.56533828316833]
複雑な人間のポーズ推定は、RGB画像と人体の表面との密接な対応を学習する問題である。
従来より密集したポーズ推定手法は、すべてMask R-CNNフレームワークに基づいており、まず各人物のバウンディングボックスを識別しようとするトップダウン方式で動作している。
そこで我々は,DDP (Direct Dense Pose) という,高密度ポーズ推定問題の解法を提案する。
論文 参考訳(メタデータ) (2022-04-04T06:14:38Z) - FP-Age: Leveraging Face Parsing Attention for Facial Age Estimation in
the Wild [50.8865921538953]
年齢推定に顔のセマンティクスを明示的に組み込む手法を提案する。
我々は,顔解析に基づくネットワークを設計し,異なるスケールで意味情報を学習する。
提案手法は,既存の年齢推定手法を常に上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-21T14:31:32Z) - Sample and Computation Redistribution for Efficient Face Detection [137.19388513633484]
トレーニングデータサンプリングと計算分布戦略は、効率的で正確な顔検出の鍵です。
scrfdf34は、最高の競合製品であるTinaFaceを3.86%(ハードセットでのAP)で上回り、GPU上でVGA解像度画像でmph3$times$より高速です。
論文 参考訳(メタデータ) (2021-05-10T23:51:14Z) - Investigating and Simplifying Masking-based Saliency Methods for Model
Interpretability [5.387323728379395]
画像の最も情報性の高い領域を識別する残差マップは、モデル解釈可能性に有用である。
唾液マップを作成するための一般的なアプローチは、画像の一部をマスクする入力マスクを生成することである。
マスキングモデルでは,クラス毎に10個のサンプルをトレーニングすることが可能であり,ローカライズエラーが0.7ポイントしか増加せず,いまだにサリエンシマップを生成可能であることを示す。
論文 参考訳(メタデータ) (2020-10-19T18:00:36Z) - Learning Expectation of Label Distribution for Facial Age and
Attractiveness Estimation [65.5880700862751]
本稿では,2つの最先端手法(Ranking-CNNとDLDL)の本質的な関係を解析し,ランキング法が実際にラベル分布を暗黙的に学習していることを示す。
軽量なネットワークアーキテクチャを提案し、顔属性の分布と回帰属性の値を共同で学習できる統一的なフレームワークを提案する。
提案手法は,36$times$パラメータが小さく,3$times$が顔の年齢/魅力度推定における高速な推論速度を持つ単一モデルを用いて,新しい最先端結果を実現する。
論文 参考訳(メタデータ) (2020-07-03T15:46:53Z) - Refined Plane Segmentation for Cuboid-Shaped Objects by Leveraging Edge
Detection [63.942632088208505]
本稿では,セグメント化された平面マスクを画像に検出されたエッジと整列するための後処理アルゴリズムを提案する。
これにより、立方体形状の物体に制限を加えながら、最先端のアプローチの精度を高めることができます。
論文 参考訳(メタデータ) (2020-03-28T18:51:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。