論文の概要: Deep Ensemble Learning with Frame Skipping for Face Anti-Spoofing
- arxiv url: http://arxiv.org/abs/2307.02858v1
- Date: Thu, 6 Jul 2023 08:50:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 14:46:44.073334
- Title: Deep Ensemble Learning with Frame Skipping for Face Anti-Spoofing
- Title(参考訳): フレームスキップによるフェイスアンチスプーフィングのための深層アンサンブル学習
- Authors: Usman Muhammad, Md Ziaul Hoque, Mourad Oussalah and Jorma Laaksonen
- Abstract要約: スプーフィング攻撃(spoofing attack)とも呼ばれる顔提示攻撃は、生体認証システムに重大な脅威をもたらす。
スプーフィングを防ぐため、連続するビデオフレームにおける顔の動きを分析するいくつかのビデオベースの手法が文献で紹介されている。
本稿では,動作予測問題として顔のアンチスプーフィングタスクを再構成し,フレームスキッピング機構を備えた深層アンサンブル学習モデルを提案する。
- 参考スコア(独自算出の注目度): 5.543184872682789
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face presentation attacks, also known as spoofing attacks, pose a significant
threat to biometric systems that rely on facial recognition systems, such as
access control systems, mobile payments, and identity verification systems. To
prevent spoofing, several video-based methods have been presented in the
literature that analyze facial motion in successive video frames. However,
estimating the motion between adjacent frames is a challenging task and
requires high computational cost. In this paper, we reformulate the face
anti-spoofing task as a motion prediction problem and introduce a deep ensemble
learning model with a frame skipping mechanism. The proposed frame skipping is
based on a uniform sampling approach where the original video is divided into
fixed size video clips. In this way, every nth frame of the clip is selected to
ensure that the temporal patterns can easily be perceived during the training
of three different recurrent neural networks (RNNs). Motivated by the
performance of each RNNs, a meta-model is developed to improve the overall
recognition performance by combining the predictions of the individual RNNs.
Extensive experiments were conducted on four datasets, and state-of-the-art
performance is reported for MSU-MFSD (3.12\%), Replay-Attack (11.19\%), and
OULU-NPU (12.23\%) using half total error rate (HTER) in the most challenging
cross-dataset test scenario.
- Abstract(参考訳): スプーフィング攻撃(spoofing attack)とも呼ばれる顔提示攻撃は、アクセス制御システム、モバイル支払いシステム、身元確認システムといった顔認識システムに依存する生体認証システムに重大な脅威をもたらす。
スプーフィングを防止するため、連続するビデオフレームで顔の動きを分析するいくつかのビデオベースの手法が文献に提示されている。
しかし、隣接するフレーム間の動きを推定することは困難であり、計算コストが高い。
本稿では,顔の反スプーフィング課題を運動予測問題として再構成し,フレームスキップ機構を備えた深層アンサンブル学習モデルを提案する。
提案するフレームスキップは,オリジナル映像を一定サイズのビデオクリップに分割する一様サンプリング手法に基づいている。
このようにして、3つの異なるリカレントニューラルネットワーク(rnn)のトレーニング中に、時間パターンを容易に認識できるように、クリップのn番目のフレームが選択される。
各RNNの性能に動機づけられたメタモデルは、個々のRNNの予測を組み合わせることにより、全体的な認識性能を向上させる。
MSU-MFSD (3.12\%)、Replay-Attack (11.19\%)、OULU-NPU (12.23\%)の4つのデータセットで実験を行い、最も難しいクロスデータセットテストシナリオでは、半総誤差率 (HTER) を使用した。
関連論文リスト
- UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - Patch Spatio-Temporal Relation Prediction for Video Anomaly Detection [19.643936110623653]
ビデオ異常検出(VAD)は、特定のコンテキストと時間枠内の異常を識別することを目的としている。
近年の深層学習に基づくVADモデルは,高解像度フレームの生成によって有望な結果を示した。
本稿では, パッチ間関係予測タスクを通じて, VADの自己教師型学習手法を提案する。
論文 参考訳(メタデータ) (2024-03-28T03:07:16Z) - Face Anti-Spoofing from the Perspective of Data Sampling [0.342658286826597]
顔提示攻撃検出は、デジタルデバイスに安全な顔アクセスを提供する上で重要な役割を果たす。
既存のビデオベースのPAD対策には、ビデオの長時間の時間変動に対処する能力がない。
本稿では,ガウス重み関数に基づく長距離時間変動をモデル化したビデオ処理方式を提案する。
論文 参考訳(メタデータ) (2022-08-28T07:54:30Z) - NSNet: Non-saliency Suppression Sampler for Efficient Video Recognition [89.84188594758588]
非定常フレームの応答を抑制するために, NSNet(Non-Sliency Suppression Network)を提案する。
NSNetは最先端の精度効率トレードオフを実現し、最先端の手法よりもはるかに高速な2.44.3xの実用的な推論速度を示す。
論文 参考訳(メタデータ) (2022-07-21T09:41:22Z) - Shuffled Patch-Wise Supervision for Presentation Attack Detection [12.031796234206135]
顔の偽造防止は、写真、ビデオ、マスク、または認証された人の顔の別の代用品を使用することによって、偽の顔認証を防止するために不可欠である。
ほとんどのプレゼンテーションアタック検出システムはオーバーフィッティングに悩まされており、1つのデータセットでほぼ完璧なスコアを得るが、より現実的なデータを持つ別のデータセットでは失敗する。
画素単位のバイナリ管理とパッチベースのCNNを組み合わせた新しいPAD手法を提案する。
論文 参考訳(メタデータ) (2021-09-08T08:14:13Z) - Frame-rate Up-conversion Detection Based on Convolutional Neural Network
for Learning Spatiotemporal Features [7.895528973776606]
本稿では、FRUCによる法医学的特徴をエンドツーエンドに学習するフレームレート変換検出ネットワーク(FCDNet)を提案する。
FCDNetは連続するフレームのスタックを入力として使用し、ネットワークブロックを使ってアーティファクトを効果的に学習して特徴を学習する。
論文 参考訳(メタデータ) (2021-03-25T08:47:46Z) - Aurora Guard: Reliable Face Anti-Spoofing via Mobile Lighting System [103.5604680001633]
紙写真やデジタルビデオの高解像度レンダリングリプレイに対する反偽造は、未解決の問題だ。
オーロラガード(Aurora Guard, AG)と呼ばれる, シンプルだが効果的な顔保護システムを提案する。
論文 参考訳(メタデータ) (2021-02-01T09:17:18Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z) - Sharp Multiple Instance Learning for DeepFake Video Detection [54.12548421282696]
我々はDeepFakeビデオに、ビデオレベルのラベルのみを提供するが、フェイクビデオのすべての顔が操作されるわけではない部分的な顔攻撃という新しい問題を導入する。
インスタンス埋め込みからバッグ予測への直接マッピングを構築する鋭いMIL(S-MIL)を提案する。
FFPMSと広く使われているDFDCデータセットの実験により、S-MILは部分的に攻撃されたDeepFakeビデオ検出において他の手法よりも優れていることが確認された。
論文 参考訳(メタデータ) (2020-08-11T08:52:17Z) - Uncertainty-Aware Weakly Supervised Action Detection from Untrimmed
Videos [82.02074241700728]
本稿では,ビデオフレームラベルのみを用いてトレーニングした,禁止レベルの行動認識モデルを提案する。
人1人当たりの手法は、複数のインスタンス学習フレームワーク内の大規模な画像データセットで訓練されている。
標準的な多重インスタンス学習の仮定では、各バッグには、指定されたラベルを持つ少なくとも1つのインスタンスが含まれているという仮定が無効である場合、どのようにメソッドを適用するかを示す。
論文 参考訳(メタデータ) (2020-07-21T10:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。