論文の概要: MogFace: Rethinking Scale Augmentation on the Face Detector
- arxiv url: http://arxiv.org/abs/2103.11139v2
- Date: Wed, 24 Mar 2021 03:08:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-26 03:46:30.851292
- Title: MogFace: Rethinking Scale Augmentation on the Face Detector
- Title(参考訳): mogface: 顔検出器のスケール拡張を再考する
- Authors: Yang Liu, Fei Wang, Baigui Sun, Hao Li
- Abstract要約: 本研究では,画像の前景情報と後景情報とスケール情報を含む先行ソリューションの違いについて検討する。
本稿では,これらの2つの情報を効率的に同時に同化できるSSE戦略を提案する。
本手法は,すべての顔検出ベンチマークにおける最先端検出性能を実現する。
- 参考スコア(独自算出の注目度): 17.570686622370403
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Face detector frequently confronts extreme scale variance challenge. The
famous solutions are Multi-scale training, Data-anchor-sampling and Random crop
strategy. In this paper, we indicate 2 significant elements to resolve extreme
scale variance problem by investigating the difference among the previous
solutions, including the fore-ground and back-ground information of an image
and the scale information. However, current excellent solutions can only
utilize the former information while neglecting to absorb the latter one
effectively. In order to help the detector utilize the scale information
efficiently, we analyze the relationship between the detector performance and
the scale distribution of the training data. Based on this analysis, we propose
a Selective Scale Enhancement (SSE) strategy which can assimilate these two
information efficiently and simultaneously. Finally, our method achieves
state-of-the-art detection performance on all common face detection benchmarks,
including AFW, PASCAL face, FDDB and Wider Face datasets. Note that our result
achieves six champions on the Wider Face dataset.
- Abstract(参考訳): 顔検出器は、しばしば極端なスケールのばらつきに直面する。
有名なソリューションは、マルチスケールトレーニング、データアンカーサンプリング、ランダムな作物戦略である。
本稿では,画像の前景情報や背景情報,スケール情報など,過去のソリューションとの違いを調べることで,超大規模分散問題を解決するための2つの重要な要素を示す。
しかし、現在の優れた解は、後者を効果的に吸収することを怠りながら、以前の情報のみを活用できる。
計測器がスケール情報を効率的に利用するのを助けるために,検出器の性能とトレーニングデータのスケール分布の関係を分析する。
そこで本研究では,これらの2つの情報を効率的に同時に同化できるSSE(Selective Scale Enhancement)戦略を提案する。
最後に,AFW,PASCALフェイス,FDDB,Wider Faceデータセットなど,すべての一般的な顔検出ベンチマークにおける最先端検出性能を実現する。
我々の結果は、Wider Faceデータセットで6つのチャンピオンを達成したことに注意してください。
関連論文リスト
- PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。
HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。
すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文 参考訳(メタデータ) (2024-08-02T09:31:21Z) - Efficient Meta-Learning Enabled Lightweight Multiscale Few-Shot Object Detection in Remote Sensing Images [15.12889076965307]
YOLOv7ワンステージ検出器は、新しいメタラーニングトレーニングフレームワークが組み込まれている。
この変換により、検出器はFSODのタスクに十分対応できると同時に、その固有の軽量化の利点を活かすことができる。
提案検出器の有効性を検証するため, 現状の検出器と性能比較を行った。
論文 参考訳(メタデータ) (2024-04-29T04:56:52Z) - YOLC: You Only Look Clusters for Tiny Object Detection in Aerial Images [33.80392696735718]
YOLC(You Only Look Clusters)は、アンカーフリーなオブジェクト検出器であるCenterNet上に構築された、効率的で効果的なフレームワークである。
大規模画像や非一様オブジェクトの分布がもたらす課題を克服するため,正確な検出のためにクラスタ領域のズームインを適応的に検索するローカルスケールモジュール(LSM)を導入する。
Visdrone 2019 と UAVDT を含む2つの航空画像データセットに対する広範な実験を行い、提案手法の有効性と優位性を実証した。
論文 参考訳(メタデータ) (2024-04-09T10:03:44Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Zooming Out on Zooming In: Advancing Super-Resolution for Remote Sensing [31.409817016287704]
リモートセンシングのための超解像は、惑星の監視に大きな影響を与える可能性がある。
多くの注意を払っているにもかかわらず、いくつかの矛盾や課題により、実際にデプロイされるのを妨げている。
この研究は、従来の測定値よりも人間の判断にはるかによく対応している、超高解像度のCLIPScoreのための新しい測定基準を示す。
論文 参考訳(メタデータ) (2023-11-29T21:06:45Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - Sample and Computation Redistribution for Efficient Face Detection [137.19388513633484]
トレーニングデータサンプリングと計算分布戦略は、効率的で正確な顔検出の鍵です。
scrfdf34は、最高の競合製品であるTinaFaceを3.86%(ハードセットでのAP)で上回り、GPU上でVGA解像度画像でmph3$times$より高速です。
論文 参考訳(メタデータ) (2021-05-10T23:51:14Z) - AOT: Appearance Optimal Transport Based Identity Swapping for Forgery
Detection [76.7063732501752]
顔偽造検出のための外観の相違が大きい新しい識別スワップアルゴリズムを提案する。
外観のギャップは主に、照明と肌の色における大きな相違から生じる。
実画像パッチと偽画像パッチの混在とを識別するために識別器を導入する。
論文 参考訳(メタデータ) (2020-11-05T06:17:04Z) - Unsupervised Feature Learning for Event Data: Direct vs Inverse Problem
Formulation [53.850686395708905]
イベントベースのカメラは、ピクセルごとの明るさ変化の非同期ストリームを記録する。
本稿では,イベントデータからの表現学習のための単一層アーキテクチャに焦点を当てる。
我々は,最先端手法と比較して,認識精度が最大9%向上したことを示す。
論文 参考訳(メタデータ) (2020-09-23T10:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。