論文の概要: KPNet: Towards Minimal Face Detector
- arxiv url: http://arxiv.org/abs/2003.07543v1
- Date: Tue, 17 Mar 2020 05:37:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 21:21:58.633687
- Title: KPNet: Towards Minimal Face Detector
- Title(参考訳): KPNet: 最小の顔検出器を目指す
- Authors: Guanglu Song, Yu Liu, Yuhang Zang, Xiaogang Wang, Biao Leng, Qingsheng
Yuan
- Abstract要約: そこで本研究では, 顔の外観の特徴を識別することで, 小さくて浅いニューラルネットワークが背景から検証できることを示す。
提案したKPNetはボトムアップ方式で顔全体の代わりに小さな顔のキーポイントを検出する。
- 参考スコア(独自算出の注目度): 27.68740638740399
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The small receptive field and capacity of minimal neural networks limit their
performance when using them to be the backbone of detectors. In this work, we
find that the appearance feature of a generic face is discriminative enough for
a tiny and shallow neural network to verify from the background. And the
essential barriers behind us are 1) the vague definition of the face bounding
box and 2) tricky design of anchor-boxes or receptive field. Unlike most
top-down methods for joint face detection and alignment, the proposed KPNet
detects small facial keypoints instead of the whole face by in a bottom-up
manner. It first predicts the facial landmarks from a low-resolution image via
the well-designed fine-grained scale approximation and scale adaptive
soft-argmax operator. Finally, the precise face bounding boxes, no matter how
we define it, can be inferred from the keypoints. Without any complex head
architecture or meticulous network designing, the KPNet achieves
state-of-the-art accuracy on generic face detection and alignment benchmarks
with only $\sim1M$ parameters, which runs at 1000fps on GPU and is easy to
perform real-time on most modern front-end chips.
- Abstract(参考訳): 最小のニューラルネットワークの小さな受容場と能力は、検出器のバックボーンとして使用する場合のパフォーマンスを制限する。
そこで本研究では,汎用的な顔の出現特性が,小型で浅いニューラルネットワークが背景から検証できるほど判別可能であることを見出した。
我々の背後にある重要な障壁は
1)顔境界ボックスの曖昧な定義と
2)アンカーボックスまたは受容フィールドのトリッキーな設計。
共同顔検出とアライメントのためのほとんどのトップダウン手法とは異なり、提案したKPNetはボトムアップ方式で顔全体の代わりに小さな顔キーポイントを検出する。
それはまず、よく設計された細粒度スケール近似とスケール適応ソフトargmax演算子によって、低解像度の画像から顔のランドマークを予測する。
最後に、正確な顔境界ボックスは、どのように定義しても、キーポイントから推測することができる。
複雑なヘッドアーキテクチャや巧妙なネットワーク設計がなければ、KPNetは一般的な顔検出およびアライメントベンチマークの最先端の精度を、GPU上で1000fpsで実行でき、ほとんどのモダンなフロントエンドチップでリアルタイムに実行することができる、わずか$\sim1M$パラメータで達成する。
関連論文リスト
- Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。
本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T12:39:56Z) - Efficient Verification-Based Face Identification [50.616875565173274]
効率の良いニューラルモデルで顔認証を行う際の問題点を$f$で検討する。
我々のモデルは、23kパラメータと5M浮動小数点演算(FLOPS)しか必要としない、かなり小さな$f$に導かれる。
我々は、6つの顔認証データセットを用いて、我々の手法が最先端のモデルよりも同等か優れていることを示す。
論文 参考訳(メタデータ) (2023-12-20T18:08:02Z) - Filter-Pruning of Lightweight Face Detectors Using a Geometric Median
Criterion [9.284740716447342]
我々は,EXTD と EResFD という,すでに小型でコンパクトな2つの顔検出器にフィルタプルーニングを実装した。
提案手法は、既に軽量な顔検出器のモデルサイズをさらに小さくする可能性がある。
論文 参考訳(メタデータ) (2023-11-28T09:02:38Z) - SqueezerFaceNet: Reducing a Small Face Recognition CNN Even More Via
Filter Pruning [55.84746218227712]
我々は,100万パラメータ未満の軽量顔認識ネットワークであるSqueezerFaceNetを開発した。
性能を損なうことなく、さらに(最大40%)削減できることを示す。
論文 参考訳(メタデータ) (2023-07-20T08:38:50Z) - A new face swap method for image and video domains: a technical report [60.47144478048589]
FaceShifterアーキテクチャに基づいた新しいフェイススワップパイプラインを導入する。
新しいアイロス機能、超解像ブロック、ガウスベースのフェイスマスク生成は、品質改善につながる。
論文 参考訳(メタデータ) (2022-02-07T10:15:50Z) - End2End Occluded Face Recognition by Masking Corrupted Features [82.27588990277192]
最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
論文 参考訳(メタデータ) (2021-08-21T09:08:41Z) - An Efficient Multitask Neural Network for Face Alignment, Head Pose
Estimation and Face Tracking [9.39854778804018]
効率的なマルチタスク顔アライメント、顔追跡、頭部ポーズ推定ネットワーク(ATPN)を提案します。
ATPNは従来の最先端手法に比べて性能が向上し、パラメータやFLOPSは少ない。
論文 参考訳(メタデータ) (2021-03-13T04:41:15Z) - Sub-pixel face landmarks using heatmaps and a bag of tricks [0.0]
顔のランドマークを正確にローカライズするための熱マップ回帰手法を提案する。
顔検出装置から顔の位置と整列に5つのナイーブな顔ランドマークを使用する。
また, デコンボリューション層とピクセルシャッフル層を混合することで, アップスケーリングの複雑さを低減できることを示した。
論文 参考訳(メタデータ) (2021-03-04T14:34:20Z) - Long-distance tiny face detection based on enhanced YOLOv3 for unmanned
system [10.856903504701712]
無人プラットフォームのためのYOLOv3アルゴリズムに基づく拡張型ネットワークモデル(YOLOv3-C)を提案する。
拡張モデルにより,長距離群集や高密度群集の場合の顔検出精度が向上する。
論文 参考訳(メタデータ) (2020-10-09T08:12:58Z) - Pixel-in-Pixel Net: Towards Efficient Facial Landmark Detection in the
Wild [104.61677518999976]
顔のランドマークを検出するために,Pixel-in-Pixel Net(PIPNet)を提案する。
提案モデルは,熱マップ回帰に基づく新しい検出ヘッドを備える。
PIPNetのクロスドメイン一般化能力をさらに向上するため,カリキュラムによる自己学習を提案する。
論文 参考訳(メタデータ) (2020-03-08T12:23:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。