論文の概要: Learning Representation and Synergy Invariances: A Povable Framework for Generalized Multimodal Face Anti-Spoofing
- arxiv url: http://arxiv.org/abs/2511.14157v1
- Date: Tue, 18 Nov 2025 05:37:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.956259
- Title: Learning Representation and Synergy Invariances: A Povable Framework for Generalized Multimodal Face Anti-Spoofing
- Title(参考訳): 学習表現と相乗的不変性:汎用多モード顔アンチスプーフィングのためのパブ可能なフレームワーク
- Authors: Xun Lin, Shuai Wang, Yi Yu, Zitong Yu, Jiale Zhou, Yizhong Liu, Xiaochun Cao, Alex Kot, Yefeng Zheng,
- Abstract要約: 複数の視覚的モダリティを統合するマルチモーダル・フェイス・アンチ・スプーフィング(FAS)法は、目に見えないドメインにデプロイすると、より深刻なパフォーマンス劣化を被ることが多い。
これは主に、クロスドメインのマルチモーダル一般化に影響を与える2つの見落とされがちなリスクによるものである。
証明可能なフレームワーク,すなわちマルチモーダル表現と相乗的不変学習(RiSe)を提案する。
- 参考スコア(独自算出の注目度): 85.00865662325954
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multimodal Face Anti-Spoofing (FAS) methods, which integrate multiple visual modalities, often suffer even more severe performance degradation than unimodal FAS when deployed in unseen domains. This is mainly due to two overlooked risks that affect cross-domain multimodal generalization. The first is the modal representation invariant risk, i.e., whether representations remain generalizable under domain shift. We theoretically show that the inherent class asymmetry in FAS (diverse spoofs vs. compact reals) enlarges the upper bound of generalization error, and this effect is further amplified in multimodal settings. The second is the modal synergy invariant risk, where models overfit to domain-specific inter-modal correlations. Such spurious synergy cannot generalize to unseen attacks in target domains, leading to performance drops. To solve these issues, we propose a provable framework, namely Multimodal Representation and Synergy Invariance Learning (RiSe). For representation risk, RiSe introduces Asymmetric Invariant Risk Minimization (AsyIRM), which learns an invariant spherical decision boundary in radial space to fit asymmetric distributions, while preserving domain cues in angular space. For synergy risk, RiSe employs Multimodal Synergy Disentanglement (MMSD), a self-supervised task enhancing intrinsic, generalizable modal features via cross-sample mixing and disentanglement. Theoretical analysis and experiments verify RiSe, which achieves state-of-the-art cross-domain performance.
- Abstract(参考訳): 複数の視覚的モダリティを統合したマルチモーダル・フェイス・アンチ・スプーフィング(FAS)法は、目に見えないドメインに配備された場合、一過性のFASよりも深刻なパフォーマンス劣化を被ることが多い。
これは主に、クロスドメインのマルチモーダル一般化に影響を与える2つの見落とされがちなリスクによるものである。
第一に、モダル表現不変リスク、すなわち、表現が領域シフトの下で一般化可能かどうかである。
理論的には、FAS(逆スプーフ対コンパクト実数)の固有のクラス非対称性は一般化誤差の上限を拡大し、この効果はマルチモーダルな設定でさらに増幅される。
2つ目は、モデルがドメイン固有のモーダル間相関に過度に適合するモーダル・シナジー不変リスクである。
このような急激なシナジーは、ターゲットドメインの目に見えない攻撃に一般化できず、パフォーマンス低下につながります。
これらの課題を解決するため、我々は、マルチモーダル表現と相乗的不変学習(RiSe)という証明可能なフレームワークを提案する。
表現リスクについて、RiSeは非対称不変リスク最小化(AsyIRM)を導入し、非対称分布に収まるためにラジアル空間の不変球面決定境界を学習し、アングル空間の領域キューを保存する。
シナジーリスクのために、RiSeはMultimodal Synergy Disentanglement (MMSD)を採用している。
理論解析と実験により、最先端のクロスドメイン性能を実現するRiSeを検証する。
関連論文リスト
- Principled Multimodal Representation Learning [99.53621521696051]
マルチモーダル表現学習は、多様なデータモダリティを統合することにより、統一された表現空間を作ろうとする。
最近の進歩は、複数のモードの同時アライメントを調査しているが、いくつかの課題が残っている。
複数モーダルの同時アライメントを実現する新しいフレームワークであるPMRL(Principled Multimodal Representation Learning)を提案する。
論文 参考訳(メタデータ) (2025-07-23T09:12:25Z) - DADM: Dual Alignment of Domain and Modality for Face Anti-spoofing [58.62312400472865]
マルチモーダル・フェイス・アンチ・スプーフィング (FAS) が顕著な研究対象となっている。
相互情報に基づくモダリティ間のアライメントモジュールを提案する。
サブドメイン超平面とモダリティ角マージンの両方を整列する双対アライメント最適化法を用いる。
論文 参考訳(メタデータ) (2025-03-01T10:12:00Z) - Invariance Principle Meets Vicinal Risk Minimization [2.026281591452464]
Invariant Risk Minimization (IRM)は、ドメイン不変の特徴を学習することでOODの一般化に取り組むことを目的としている。
ラベル一貫性を維持しつつデータセットの多様性を向上させるために,ドメイン共有セマンティックデータ拡張(SDA)モジュールを提案する。
論文 参考訳(メタデータ) (2024-07-08T09:16:42Z) - Suppress and Rebalance: Towards Generalized Multi-Modal Face
Anti-Spoofing [26.901402236963374]
Face Anti-Spoofing (FAS) は、顔認証システムのプレゼンテーション攻撃に対する保護に不可欠である。
多くのマルチモーダルなFASアプローチが出現しているが、見当たらない攻撃や展開条件を一般化する上での課題に直面している。
論文 参考訳(メタデータ) (2024-02-29T16:06:36Z) - Domain-Specific Risk Minimization for Out-of-Distribution Generalization [104.17683265084757]
まず、適応性ギャップを明示的に考慮した一般化境界を確立する。
本稿では,目標に対するより良い仮説の選択を導くための効果的なギャップ推定法を提案する。
もう1つの方法は、オンラインターゲットサンプルを用いてモデルパラメータを適応させることにより、ギャップを最小化することである。
論文 参考訳(メタデータ) (2022-08-18T06:42:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。