論文の概要: ACFD: Asymmetric Cartoon Face Detector
- arxiv url: http://arxiv.org/abs/2007.00899v1
- Date: Thu, 2 Jul 2020 05:57:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 14:18:05.690608
- Title: ACFD: Asymmetric Cartoon Face Detector
- Title(参考訳): ACFD:非対称カルトン顔検出器
- Authors: Bin Zhang, Jian Li, Yabiao Wang, Zhipeng Cui, Yili Xia, Chengjie Wang,
Jilin Li, Feiyue Huang
- Abstract要約: ACFDは2020年のiCartoon Face Challengeで1位を獲得した。
ACFDは、モデルサイズ200MB、画像あたりの推測時間50ms、事前訓練されたモデルなしで、2020年のiCartoon Face Challengeの1位を獲得しました。
- 参考スコア(独自算出の注目度): 72.60983975604145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cartoon face detection is a more challenging task than human face detection
due to many difficult scenarios is involved. Aiming at the characteristics of
cartoon faces, such as huge differences within the intra-faces, in this paper,
we propose an asymmetric cartoon face detector, named ACFD. Specifically, it
consists of the following modules: a novel backbone VoVNetV3 comprised of
several asymmetric one-shot aggregation modules (AOSA), asymmetric
bi-directional feature pyramid network (ABi-FPN), dynamic anchor match strategy
(DAM) and the corresponding margin binary classification loss (MBC). In
particular, to generate features with diverse receptive fields, multi-scale
pyramid features are extracted by VoVNetV3, and then fused and enhanced
simultaneously by ABi-FPN for handling the faces in some extreme poses and have
disparate aspect ratios. Besides, DAM is used to match enough high-quality
anchors for each face, and MBC is for the strong power of discrimination. With
the effectiveness of these modules, our ACFD achieves the 1st place on the
detection track of 2020 iCartoon Face Challenge under the constraints of model
size 200MB, inference time 50ms per image, and without any pretrained models.
- Abstract(参考訳): カルトゥーンの顔検出は、難しいシナリオが多いため、人間の顔検出よりも難しい作業である。
本稿では, 顔内における大きな違いなど, マンガの顔の特徴に着目し, ACFD という非対称なマンガの顔検出手法を提案する。
具体的には、いくつかの非対称な単発アグリゲーションモジュール(AOSA)、非対称な双方向特徴ピラミッドネットワーク(ABi-FPN)、動的アンカーマッチング戦略(DAM)、対応するマージン二分分類損失(MBC)からなる新しいバックボーンVoVNetV3である。
特に、多様な受容場を持つ特徴を生成するために、VoVNetV3によりマルチスケールピラミッドの特徴を抽出し、いくつかの極端なポーズで顔を扱うためにABi-FPNによって同時に融合・拡張され、異なるアスペクト比を有する。
さらに、DAMは顔ごとに十分な高品質のアンカーに適合し、MBCは差別の強い力である。
これらのモジュールの有効性により,acfdは,モデルサイズ200mb,イメージあたりの推論時間50ms,トレーニング済みモデルなしで,2020 icartoon face challengeの検出トラックで第1位を達成した。
関連論文リスト
- Unified Physical-Digital Face Attack Detection [66.14645299430157]
顔認識(FR)システムは物理的(印刷写真)とデジタル(ディープフェイク)攻撃に悩まされることがある。
以前の関連する作業では、両方の状況が同時に考慮されることはめったにありません。
視覚言語モデル(VLM)に基づく一元攻撃検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-31T09:38:44Z) - Learning Dense Correspondence for NeRF-Based Face Reenactment [24.072019889495966]
本研究では,三面体を基本的なNeRF表現として採用し,顔三面体を正準三面体,恒等変形,運動の3つの構成要素に分解する新しい枠組みを提案する。
筆者らのフレームワークは,従来の3次元パラメトリックモデルを使わずに,ワンショットの多視点顔再現を実現する最初の手法である。
論文 参考訳(メタデータ) (2023-12-16T11:31:34Z) - A Closer Look at Geometric Temporal Dynamics for Face Anti-Spoofing [13.725319422213623]
顔認識システムにはFAS(face anti-spoofing)が不可欠である。
本稿では,通常動作と異常動作を区別するGeometry-Aware Interaction Network (GAIN)を提案する。
提案手法は,標準内部およびクロスデータセット評価における最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-25T18:59:52Z) - Surveillance Face Anti-spoofing [81.50018853811895]
Face Anti-Spoofing (FAS) は、様々な物理的攻撃から顔認識システムを保護するために不可欠である。
本稿では,画像品質による性能劣化を軽減するために,コントラスト品質不変学習(CQIL)ネットワークを提案する。
多くの実験がSuHiFiMaskデータセットの品質と提案したCQILの優位性を検証する。
論文 参考訳(メタデータ) (2023-01-03T07:09:57Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Two-stream Convolutional Networks for Multi-frame Face Anti-spoofing [1.9890930069402575]
本研究では,ライブとスプーフの顔の違いを効果的に把握する2ストリームモデルを提案する。
提案手法をSiw, Oulu-NPU, CASIA-MFSD, Replay-Attackのデータセット上で評価した。
論文 参考訳(メタデータ) (2021-08-09T13:35:30Z) - Wide Aspect Ratio Matching for Robust Face Detection [11.593495085674345]
アンカーと極端なアスペクト比面の間の最大IoUsはまだ固定サンプリングしきい値よりも低いです。
地層面からより代表的な正のアンカーを集めるためのワイドアスペクト比マッチング(WARM)戦略を提案します。
また,異なるアスペクト比に対応する多様な受容場を提供するために,RFD(Receptive Field Diversity)モジュールという新たな機能拡張モジュールを提案する。
論文 参考訳(メタデータ) (2021-03-10T11:05:38Z) - Face Anti-Spoofing with Human Material Perception [76.4844593082362]
フェース・アンチ・スプーフィング(FAS)は、プレゼンテーション攻撃から顔認識システムを保護する上で重要な役割を担っている。
我々は、顔の反偽造を物質認識問題として言い換え、それを古典的な人間の物質知覚と組み合わせる。
本稿では,本質的な素材に基づくパターンをキャプチャ可能なバイラテラル畳み込みネットワーク(BCN)を提案する。
論文 参考訳(メタデータ) (2020-07-04T18:25:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。