論文の概要: EventFace: Event-Based Face Recognition via Structure-Driven Spatiotemporal Modeling
- arxiv url: http://arxiv.org/abs/2604.06782v1
- Date: Wed, 08 Apr 2026 07:52:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.407969
- Title: EventFace: Event-Based Face Recognition via Structure-Driven Spatiotemporal Modeling
- Title(参考訳): EventFace: 構造駆動時空間モデリングによるイベントベースの顔認識
- Authors: Qingguo Meng, Xingbo Dong, Zhe Jin, Massimo Tistarelli,
- Abstract要約: イベントカメラは、照明のロバスト性やプライバシーのフレンドリさに固有の利点があるため、顔認識に期待できるモダリティを提供する。
イベントベースの顔認識は、剛性な顔の動きと個々の顔形状によって形成される構造駆動のアイデンティティ表現をモデル化すべきである、と我々は主張する。
本研究では,イベントベースの顔認識フレームワークであるEventFaceを提案する。
- 参考スコア(独自算出の注目度): 15.313758078552437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Event cameras offer a promising sensing modality for face recognition due to their inherent advantages in illumination robustness and privacy-friendliness. However, because event streams lack the stable photometric appearance relied upon by conventional RGB-based face recognition systems, we argue that event-based face recognition should model structure-driven spatiotemporal identity representations shaped by rigid facial motion and individual facial geometry. Since dedicated datasets for event-based face recognition remain lacking, we construct EFace, a small-scale event-based face dataset captured under rigid facial motion. To learn effectively from this limited event data, we further propose EventFace, a framework for event-based face recognition that integrates spatial structure and temporal dynamics for identity modeling. Specifically, we employ Low-Rank Adaptation (LoRA) to transfer structural facial priors from pretrained RGB face models to the event domain, thereby establishing a reliable spatial basis for identity modeling. Building on this foundation, we further introduce a Motion Prompt Encoder (MPE) to explicitly encode temporal features and a Spatiotemporal Modulator (STM) to fuse them with spatial features, thereby enhancing the representation of identity-relevant event patterns. Extensive experiments demonstrate that EventFace achieves the best performance among the evaluated baselines, with a Rank-1 identification rate of 94.19% and an equal error rate (EER) of 5.35%. Results further indicate that EventFace exhibits stronger robustness under degraded illumination than the competing methods. In addition, the learned representations exhibit reduced template reconstructability.
- Abstract(参考訳): イベントカメラは、照明のロバスト性やプライバシーのフレンドリさに固有の利点があるため、顔認識に期待できるモダリティを提供する。
しかし, イベントストリームは従来のRGBベースの顔認識システムに頼っている安定な測光外観を欠いているため, イベントベースの顔認識は, 剛体的な顔の動きと個々の顔形状によって形成される時空間的同一性表現をモデル化すべきである,と論じる。
イベントベースの顔認識のための専用データセットは依然として不足しているため、厳格な顔の動きでキャプチャされた小規模のイベントベースの顔データセットであるEFaceを構築した。
この限られたイベントデータから効果的に学習するために,イベントベースの顔認識フレームワークであるEventFaceを提案する。
具体的には、Low-Rank Adaptation (LoRA) を用いて、事前訓練されたRGB顔モデルからイベントドメインへ構造的顔の事前情報を転送し、アイデンティティモデリングのための信頼性の高い空間的基盤を確立する。
この基礎の上に、時間的特徴を明示的にエンコードするモーションプロンプトエンコーダ(MPE)と、空間的特徴を融合する時空間変調器(STM)を導入し、アイデンティティ関連イベントパターンの表現を強化する。
大規模な実験では、EventFaceは評価されたベースラインの中で最高のパフォーマンスを達成しており、ランク1の識別率は94.19%、エラーレートは5.35%である。
結果はさらに、EventFaceは競合するメソッドよりも劣化した照明下で強い堅牢性を示すことを示している。
さらに、学習された表現はテンプレート再構成可能性の低下を示す。
関連論文リスト
- SIDeR: Semantic Identity Decoupling for Unrestricted Face Privacy [53.75084833636302]
本稿では,非制限顔プライバシー保護のためのセマンティックデカップリング駆動フレームワークSIDeRを提案する。
SIDeRは、顔画像をマシン認識可能な識別特徴ベクトルと視覚的に知覚可能なセマンティックな外観成分に分解する。
認証されたアクセスのために、SIDeRは正しいパスワードが提供されるときに元の形式に復元できる。
論文 参考訳(メタデータ) (2026-02-04T19:30:48Z) - CLIP-FTI: Fine-Grained Face Template Inversion via CLIP-Driven Attribute Conditioning [15.01028853162385]
顔認識システムは、効率的なマッチングのために顔テンプレートを格納する。
逆転することでプライバシーを侵害し、偽装を可能にするサロゲートが生成される。
顔テンプレートインバージョンのためのCLIP駆動の微粒化属性条件付けフレームワークであるCLIP-FTIを提案する。
論文 参考訳(メタデータ) (2025-12-17T13:26:34Z) - Event-based Facial Keypoint Alignment via Cross-Modal Fusion Attention and Self-Supervised Multi-Event Representation Learning [16.170645576584487]
イベントカメラは、困難な条件下での顔のキーポイントアライメントにユニークな利点を提供する。
本稿では、イベントベースの顔キーポイントアライメントのための、相互統合注意(CMFA)と自己教師型マルチイベント表現学習(SSMER)に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-29T16:00:50Z) - evTransFER: A Transfer Learning Framework for Event-based Facial Expression Recognition [0.0]
イベントベースカメラを用いた顔の表情認識のための学習型フレームワークとアーキテクチャを提案する。
提案手法は,表情認識能力を大幅に向上させることを示す。
さらに,LSTMを組み込んで顔表情の長期的ダイナミクスをキャプチャするアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-08-05T16:26:09Z) - OSDFace: One-Step Diffusion Model for Face Restoration [72.5045389847792]
拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-26T07:07:48Z) - FaceDancer: Pose- and Occlusion-Aware High Fidelity Face Swapping [62.38898610210771]
そこで我々は,FaceDancerという顔のスワップとID転送のための新しい単一ステージ手法を提案する。
アダプティブ・フィーチャー・フュージョン・アテンション(AFFA)と解釈的特徴類似性規則化(IFSR)の2つの主要なコントリビューションがある。
論文 参考訳(メタデータ) (2022-10-19T11:31:38Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。