論文の概要: Learning Meta Pattern for Face Anti-Spoofing
- arxiv url: http://arxiv.org/abs/2110.06753v1
- Date: Wed, 13 Oct 2021 14:34:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 15:43:26.440029
- Title: Learning Meta Pattern for Face Anti-Spoofing
- Title(参考訳): フェイスアンチスプーフィングのための学習メタパターン
- Authors: Rizhao Cai, Zhi Li, Renjie Wan, Haoliang Li, Yongjian Hu, Alex
Chichung Kot
- Abstract要約: 顔認証システムにはFAS(Face Anti-Spoofing)が不可欠である。
近年,タスク対応手工芸品の特徴を抽出するためのハイブリッド手法が研究されている。
学習から学習までのフレームワークでメタパターン(MP)を抽出する学習可能なネットワークを提案する。
- 参考スコア(独自算出の注目度): 26.82129880310214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face Anti-Spoofing (FAS) is essential to secure face recognition systems and
has been extensively studied in recent years. Although deep neural networks
(DNNs) for the FAS task have achieved promising results in intra-dataset
experiments with similar distributions of training and testing data, the DNNs'
generalization ability is limited under the cross-domain scenarios with
different distributions of training and testing data. To improve the
generalization ability, recent hybrid methods have been explored to extract
task-aware handcrafted features (e.g., Local Binary Pattern) as discriminative
information for the input of DNNs. However, the handcrafted feature extraction
relies on experts' domain knowledge, and how to choose appropriate handcrafted
features is underexplored. To this end, we propose a learnable network to
extract Meta Pattern (MP) in our learning-to-learn framework. By replacing
handcrafted features with the MP, the discriminative information from MP is
capable of learning a more generalized model. Moreover, we devise a two-stream
network to hierarchically fuse the input RGB image and the extracted MP by
using our proposed Hierarchical Fusion Module (HFM). We conduct comprehensive
experiments and show that our MP outperforms the compared handcrafted features.
Also, our proposed method with HFM and the MP can achieve state-of-the-art
performance on two different domain generalization evaluation benchmarks.
- Abstract(参考訳): 顔認識システムにはFAS(Face Anti-Spoofing)が不可欠であり,近年広く研究されている。
FASタスクのためのディープニューラルネットワーク(DNN)は、トレーニングデータとテストデータの同様の分布を持つデータセット内実験で有望な結果を得たが、DNNの一般化能力は、トレーニングデータとテストデータの分布が異なるクロスドメインシナリオ下で制限されている。
一般化能力を向上させるため,近年,DNNの入力の識別情報としてタスク対応手作り特徴(ローカルバイナリパターンなど)を抽出する手法が研究されている。
しかし、手作りの特徴抽出は専門家のドメイン知識に依存しており、適切な手作り特徴の選択方法が未検討である。
そこで我々は,学習から学習までのフレームワークでメタパターン(MP)を抽出する学習可能なネットワークを提案する。
手作りの機能をMPに置き換えることで、MPからの識別情報はより一般化されたモデルを学ぶことができる。
さらに,提案する階層型融合モジュール(hfm)を用いて,入力rgb画像と抽出したmp画像とを階層的に融合する2ストリームネットワークを考案する。
我々は包括的な実験を行い、MPが比較した手作り機能より優れていることを示す。
また, HFM と MP を用いた提案手法は, 2 つの異なる領域一般化評価ベンチマークにおいて最先端の性能を実現することができる。
関連論文リスト
- Mixture-of-Noises Enhanced Forgery-Aware Predictor for Multi-Face Manipulation Detection and Localization [52.87635234206178]
本稿では,多面的操作検出と局所化に適したMoNFAPという新しいフレームワークを提案する。
このフレームワークには2つの新しいモジュールが含まれている: Forgery-aware Unified Predictor (FUP) Module と Mixture-of-Noises Module (MNM)。
論文 参考訳(メタデータ) (2024-08-05T08:35:59Z) - CMFDFormer: Transformer-based Copy-Move Forgery Detection with Continual
Learning [52.72888626663642]
コピーモーブ偽造検出は、疑わしい偽画像中の重複領域を検出することを目的としている。
深層学習に基づく複写偽造検出手法が最上位にある。
CMFDFormer という名称の Transformer-style copy-move forgery ネットワークを提案する。
また、CMFDFormerが新しいタスクを処理できるように、新しいPCSD連続学習フレームワークを提供する。
論文 参考訳(メタデータ) (2023-11-22T09:27:46Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - EMERSK -- Explainable Multimodal Emotion Recognition with Situational
Knowledge [0.0]
状況知識を用いた説明可能なマルチモーダル感情認識(EMERSK)を提案する。
EMERSKは視覚情報を用いた人間の感情認識と説明のための汎用システムである。
本システムは, 表情, 姿勢, 歩行などの複数のモーダルを柔軟かつモジュラーな方法で処理することができる。
論文 参考訳(メタデータ) (2023-06-14T17:52:37Z) - Learning Modular Structures That Generalize Out-of-Distribution [1.7034813545878589]
本稿では、O.O.D.の一般化手法について述べる。トレーニングを通じて、複数のトレーニング領域にまたがってよく再利用されるネットワークの機能のみをモデルが保持することを奨励する。
本手法は,2つの相補的ニューロンレベル正規化器とネットワーク上の確率的微分可能なバイナリマスクを組み合わせることで,元のネットワークよりも優れたO.O.D.性能を実現するモジュールサブネットワークを抽出する。
論文 参考訳(メタデータ) (2022-08-07T15:54:19Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - Exploiting Emotional Dependencies with Graph Convolutional Networks for
Facial Expression Recognition [31.40575057347465]
本稿では,視覚における表情認識のためのマルチタスク学習フレームワークを提案する。
MTL設定において、離散認識と連続認識の両方のために共有特徴表現が学習される。
実験の結果,本手法は離散FER上での最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-06-07T10:20:05Z) - Face Anti-Spoofing with Human Material Perception [76.4844593082362]
フェース・アンチ・スプーフィング(FAS)は、プレゼンテーション攻撃から顔認識システムを保護する上で重要な役割を担っている。
我々は、顔の反偽造を物質認識問題として言い換え、それを古典的な人間の物質知覚と組み合わせる。
本稿では,本質的な素材に基づくパターンをキャプチャ可能なバイラテラル畳み込みネットワーク(BCN)を提案する。
論文 参考訳(メタデータ) (2020-07-04T18:25:53Z) - A Transductive Multi-Head Model for Cross-Domain Few-Shot Learning [72.30054522048553]
本稿では,クロスドメインなFew-Shot学習問題に対処するため,TMHFS(Transductive Multi-Head Few-Shot Learning)を提案する。
提案手法は, 4つの異なる対象領域において, 強いベースライン, 微調整を著しく上回っている。
論文 参考訳(メタデータ) (2020-06-08T02:39:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。