論文の概要: Mixture-of-Attack-Experts with Class Regularization for Unified Physical-Digital Face Attack Detection
- arxiv url: http://arxiv.org/abs/2504.00458v1
- Date: Tue, 01 Apr 2025 06:33:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:22:05.542269
- Title: Mixture-of-Attack-Experts with Class Regularization for Unified Physical-Digital Face Attack Detection
- Title(参考訳): 身近な顔検出のためのクラス正規化を伴う混在検体
- Authors: Shunxin Chen, Ajian Liu, Junze Zheng, Jun Wan, Kailai Peng, Sergio Escalera, Zhen Lei,
- Abstract要約: 現実のシナリオにおける顔認識システムは、デジタル攻撃と物理的攻撃の両方に影響を受けやすい。
従来は包括的特徴空間を学習して分類を試みてきた。
クラス認識正規化CLIPフレームワーク(FG-MoE-CLIP-CAR)を用いたファイングラインドMoEを提案する。
2つの統合物理デジタル攻撃データセットの実験結果から,提案手法がSOTA(State-of-the-art)性能を実現することを示す。
- 参考スコア(独自算出の注目度): 45.59451145116377
- License:
- Abstract: Facial recognition systems in real-world scenarios are susceptible to both digital and physical attacks. Previous methods have attempted to achieve classification by learning a comprehensive feature space. However, these methods have not adequately accounted for the inherent characteristics of physical and digital attack data, particularly the large intra class variation in attacks and the small inter-class variation between live and fake faces. To address these limitations, we propose the Fine-Grained MoE with Class-Aware Regularization CLIP framework (FG-MoE-CLIP-CAR), incorporating key improvements at both the feature and loss levels. At the feature level, we employ a Soft Mixture of Experts (Soft MoE) architecture to leverage different experts for specialized feature processing. Additionally, we refine the Soft MoE to capture more subtle differences among various types of fake faces. At the loss level, we introduce two constraint modules: the Disentanglement Module (DM) and the Cluster Distillation Module (CDM). The DM enhances class separability by increasing the distance between the centers of live and fake face classes. However, center-to-center constraints alone are insufficient to ensure distinctive representations for individual features. Thus, we propose the CDM to further cluster features around their respective class centers while maintaining separation from other classes. Moreover, specific attacks that significantly deviate from common attack patterns are often overlooked. To address this issue, our distance calculation prioritizes more distant features. Experimental results on two unified physical-digital attack datasets demonstrate that the proposed method achieves state-of-the-art (SOTA) performance.
- Abstract(参考訳): 現実のシナリオにおける顔認識システムは、デジタル攻撃と物理的攻撃の両方に影響を受けやすい。
従来は包括的特徴空間を学習して分類を試みてきた。
しかし,これらの手法は,身体的およびデジタル的攻撃データの特徴,特に攻撃における大きなクラス内変動と,生顔と偽顔のクラス間変化を適切に考慮していない。
これらの制約に対処するため,FG-MoE-CLIP-CAR(FG-MoE-CLIP-CAR)フレームワークを用いたFine-Grained MoEを提案する。
機能レベルでは、特殊機能処理にさまざまな専門家を活用するために、Soft Mixture of Experts (Soft MoE)アーキテクチャを使用します。
さらに、様々な種類の偽の顔の微妙な違いを捉えるために、Soft MoEを洗練します。
損失レベルでは、Disentanglement Module (DM) とCluster Distillation Module (CDM) の2つの制約モジュールを導入する。
DMは、生きた顔と偽の顔のクラスの間の距離を増やすことにより、クラス分離性を高める。
しかし、中心から中心への制約だけでは、個々の特徴の独特な表現を保証するには不十分である。
そこで本研究では,他のクラスとの分離を維持しつつ,各クラスセンターにまたがる機能をクラスタ化するCDMを提案する。
さらに、一般的な攻撃パターンから著しく逸脱する特定の攻撃は、しばしば見過ごされる。
この問題に対処するため、我々の距離計算はより離れた特徴を優先する。
2つの統合物理デジタル攻撃データセットの実験結果から,提案手法がSOTA(State-of-the-art)性能を実現することを示す。
関連論文リスト
- La-SoftMoE CLIP for Unified Physical-Digital Face Attack Detection [27.020392407198948]
顔認識システムは、物理的攻撃とデジタル攻撃の両方に影響を受けやすい。
スパースモデルを用いてスパースデータを処理する新しい手法を提案する。
フレキシブルな自己適応型重み付け機構を導入し、モデルに適合し、適応できるようにします。
論文 参考訳(メタデータ) (2024-08-23T02:12:13Z) - Unified Physical-Digital Face Attack Detection [66.14645299430157]
顔認識(FR)システムは物理的(印刷写真)とデジタル(ディープフェイク)攻撃に悩まされることがある。
以前の関連する作業では、両方の状況が同時に考慮されることはめったにありません。
視覚言語モデル(VLM)に基づく一元攻撃検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-31T09:38:44Z) - Hyperbolic Face Anti-Spoofing [21.981129022417306]
双曲空間におけるよりリッチな階層的および差別的なスプーフィングキューを学習することを提案する。
単調なFAS学習では、特徴埋め込みはポアンカーボールに投影され、双対対対数回帰層は分類のためにカスケードされる。
双曲空間における消失勾配問題を緩和するために,双曲モデルのトレーニング安定性を高めるために,新しい特徴クリッピング法を提案する。
論文 参考訳(メタデータ) (2023-08-17T17:18:21Z) - Multi-spectral Class Center Network for Face Manipulation Detection and Localization [52.569170436393165]
顔の操作検出と局所化のための新しいマルチスペクトル・クラス・センター・ネットワーク(MSCCNet)を提案する。
周波数帯域の異なる特徴に基づき、MSCCモジュールはマルチスペクトルクラスセンターを収集し、ピクセル対クラス関係を計算する。
多スペクトルクラスレベルの表現を適用することで、偽画像の操作された領域に敏感な視覚概念の意味情報を抑えることができる。
論文 参考訳(メタデータ) (2023-05-18T08:09:20Z) - DiGeo: Discriminative Geometry-Aware Learning for Generalized Few-Shot
Object Detection [39.937724871284665]
汎用的な少ショットオブジェクト検出は、豊富なアノテーションと限られたトレーニングデータを持つ新しいクラスで、両方のベースクラス上で正確な検出を実現することを目的としている。
既存のアプローチは、ベースクラスのパフォーマンスを犠牲にして、数ショットの一般化を促進する。
クラス間分離とクラス内コンパクト性の幾何学的特徴を学習するための新しいトレーニングフレームワークDiGeoを提案する。
論文 参考訳(メタデータ) (2023-03-16T22:37:09Z) - Dual Contrastive Learning for General Face Forgery Detection [64.41970626226221]
本稿では,正と負のペアデータを構成するDCL (Dual Contrastive Learning) という新しい顔偽造検出フレームワークを提案する。
本研究は, 事例内コントラスト学習(Intra-ICL)において, 偽造顔における局所的内容の不整合に焦点をあてる。
論文 参考訳(メタデータ) (2021-12-27T05:44:40Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Frequency-aware Discriminative Feature Learning Supervised by
Single-Center Loss for Face Forgery Detection [89.43987367139724]
顔の偽造検出は、コンピュータビジョンへの関心をますます高めている。
近年の業績は良好なものとなっているが、いまだに無視できない問題がある。
本稿では,新しい周波数認識型特徴学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-16T14:17:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。