論文の概要: FoundPAD: Foundation Models Reloaded for Face Presentation Attack Detection
- arxiv url: http://arxiv.org/abs/2501.02892v1
- Date: Mon, 06 Jan 2025 10:14:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:07:02.595179
- Title: FoundPAD: Foundation Models Reloaded for Face Presentation Attack Detection
- Title(参考訳): FoundPAD:顔提示攻撃検出のためにリロードされたファンデーションモデル
- Authors: Guray Ozgur, Eduarda Caldeira, Tahar Chettaoui, Fadi Boutros, Raghavendra Ramachandra, Naser Damer,
- Abstract要約: プレゼンテーションアタック検出(PAD)アルゴリズムは、目に見えない領域に一般化する必要がある。
ファンデーションモデル(FM)は、広範囲なデータセットで事前訓練され、目に見えない領域に一般化する際、顕著な結果が得られる。
FoundPADの実装はhttps://github.com/gurayozgur/FoundPADで公開しています。
- 参考スコア(独自算出の注目度): 8.605999078286567
- License:
- Abstract: Although face recognition systems have seen a massive performance enhancement in recent years, they are still targeted by threats such as presentation attacks, leading to the need for generalizable presentation attack detection (PAD) algorithms. Current PAD solutions suffer from two main problems: low generalization to unknown cenarios and large training data requirements. Foundation models (FM) are pre-trained on extensive datasets, achieving remarkable results when generalizing to unseen domains and allowing for efficient task-specific adaption even when little training data are available. In this work, we recognize the potential of FMs to address common PAD problems and tackle the PAD task with an adapted FM for the first time. The FM under consideration is adapted with LoRA weights while simultaneously training a classification header. The resultant architecture, FoundPAD, is highly generalizable to unseen domains, achieving competitive results in several settings under different data availability scenarios and even when using synthetic training data. To encourage reproducibility and facilitate further research in PAD, we publicly release the implementation of FoundPAD at https://github.com/gurayozgur/FoundPAD .
- Abstract(参考訳): 近年、顔認識システムの性能は大幅に向上しているが、プレゼンテーションアタックなどの脅威を標的にしており、汎用化可能なプレゼンテーションアタック検出(PAD)アルゴリズムの必要性が高まっている。
現在のPADソリューションは、未知のセリオへの低一般化と大規模なトレーニングデータ要求の2つの主な問題に悩まされている。
ファンデーションモデル(FM)は、広範囲なデータセットで事前トレーニングされ、目に見えないドメインに一般化する際、顕著な結果を達成するとともに、トレーニングデータが少ない場合でも、効率的なタスク固有の適応を可能にする。
本研究では,一般的なPAD問題に対処するFMの可能性を認識し,適応されたFMを用いてPADタスクに初めて取り組む。
FMはLoRA重みに適応し、同時に分類ヘッダーを訓練する。
結果のアーキテクチャであるFoundPADは、目に見えないドメインに対して非常に一般化可能であり、異なるデータ可用性シナリオや、合成トレーニングデータを使用する場合でさえ、いくつかの設定で競合する結果を達成する。
PADにおける再現性を奨励し、さらなる研究を促進するため、私たちは https://github.com/gurayozgur/FoundPAD で FoundPAD の実装を公開しています。
関連論文リスト
- Towards Data-Centric Face Anti-Spoofing: Improving Cross-domain Generalization via Physics-based Data Synthesis [64.46312434121455]
Face Anti-Spoofing (FAS) 研究は、トレーニングデータとテストデータの間にドメインギャップがあるクロスドメイン問題によって難題となっている。
本研究では,タスク固有のFASデータ拡張(FAS-Aug)を提案する。
また,特定の種類のアーティファクトをモデルが依存しないようにし,一般化性能を向上させるために,SARE(Spowing Attack Risk Equalization)を提案する。
論文 参考訳(メタデータ) (2024-09-04T01:45:18Z) - MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。
近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。
SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文 参考訳(メタデータ) (2024-04-13T13:39:26Z) - CAAP: Class-Dependent Automatic Data Augmentation Based On Adaptive Policies For Time Series [5.487882744996215]
本稿では,クラス依存型自動適応ポリシー(CAAP)フレームワークという,ディープラーニングに基づく新しいアプローチを提案する。
CAAPフレームワークは、時系列データ拡張の全体的な改善を維持しながら、注目すべきクラス依存バイアス問題を克服する。
その結果,CAAPは,クラス依存バイアスの低減と,全体的な性能の向上を両立させる上で,代表的手法よりも優れていた。
論文 参考訳(メタデータ) (2024-04-01T03:51:38Z) - Face Presentation Attack Detection by Excavating Causal Clues and
Adapting Embedding Statistics [9.612556145185431]
顔提示攻撃検出(PAD)はドメイン適応(DA)とドメイン一般化(DG)技術を用いて未知のドメインの性能劣化に対処する。
ほとんどのDGベースのPADソリューションは、プライオリ、すなわち既知のドメインラベルに依存している。
本稿では、因果的観点から複合DGタスクとして顔PADをモデル化し、モデル最適化にリンクすることを提案する。
論文 参考訳(メタデータ) (2023-08-28T13:11:05Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Face Presentation Attack Detection using Taskonomy Feature [26.343512092423985]
顔認識システム(FRS)の安全性を確保するため、提示攻撃検出(PAD)手法が重要である
既存のPAD法は、限られたトレーニングセットに大きく依存しており、未知のPAによく当てはまらない。
我々は、他の顔関連タスクからタスクノミー(タスク分類)を適用して、顔PADを解決することを提案する。
論文 参考訳(メタデータ) (2021-11-22T08:35:26Z) - Federated Test-Time Adaptive Face Presentation Attack Detection with
Dual-Phase Privacy Preservation [100.69458267888962]
顔提示攻撃検出(fPAD)は、現代の顔認識パイプラインにおいて重要な役割を果たす。
法的およびプライバシー上の問題により、トレーニングデータ(実際の顔画像と偽画像)は、異なるデータソース間で直接共有することはできない。
本稿では,二相プライバシー保護フレームワークを用いたフェデレーションテスト時間適応顔提示検出を提案する。
論文 参考訳(メタデータ) (2021-10-25T02:51:05Z) - Adversarial Unsupervised Domain Adaptation Guided with Deep Clustering
for Face Presentation Attack Detection [0.8701566919381223]
顔提示攻撃検知(PAD)は顔認識システムを確保するために注目されている。
PAD一般化能力を改善するために,ドメイン適応(DA)に基づくエンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-13T05:34:40Z) - Multi-Domain Adversarial Feature Generalization for Person
Re-Identification [52.835955258959785]
マルチデータセット特徴一般化ネットワーク(MMFA-AAE)を提案する。
複数のラベル付きデータセットから普遍的なドメイン不変の特徴表現を学習し、それを見えないカメラシステムに一般化することができる。
また、最先端の教師付き手法や教師なしのドメイン適応手法を大きなマージンで超えている。
論文 参考訳(メタデータ) (2020-11-25T08:03:15Z) - Cross-domain Face Presentation Attack Detection via Multi-domain
Disentangled Representation Learning [109.42987031347582]
顔提示攻撃検出(PAD)は,顔認識システムにおいて緊急に解決すべき課題である。
クロスドメイン顔PADのための効率的な非交叉表現学習を提案する。
我々のアプローチは、不整合表現学習(DR-Net)とマルチドメイン学習(MD-Net)からなる。
論文 参考訳(メタデータ) (2020-04-04T15:45:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。