論文の概要: Deep Ensemble Learning with Frame Skipping for Face Anti-Spoofing
- arxiv url: http://arxiv.org/abs/2307.02858v2
- Date: Tue, 11 Jul 2023 07:06:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-12 17:50:20.774111
- Title: Deep Ensemble Learning with Frame Skipping for Face Anti-Spoofing
- Title(参考訳): フレームスキップによるフェイスアンチスプーフィングのための深層アンサンブル学習
- Authors: Usman Muhammad, Md Ziaul Hoque, Mourad Oussalah and Jorma Laaksonen
- Abstract要約: 顔提示攻撃 (PA) は生体認証システムに重大な脅威をもたらす。
連続するビデオフレームにおける顔の動きを解析するいくつかのビデオベース手法が文献で紹介されている。
本稿では,顔のアンチスプーフ処理を動作予測問題として言い換え,フレームスキッピング機構を備えた深層アンサンブル学習モデルを提案する。
- 参考スコア(独自算出の注目度): 5.543184872682789
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face presentation attacks (PA), also known as spoofing attacks, pose a
substantial threat to biometric systems that rely on facial recognition
systems, such as access control systems, mobile payments, and identity
verification systems. To mitigate the spoofing risk, several video-based
methods have been presented in the literature that analyze facial motion in
successive video frames. However, estimating the motion between adjacent frames
is a challenging task and requires high computational cost. In this paper, we
rephrase the face anti-spoofing task as a motion prediction problem and
introduce a deep ensemble learning model with a frame skipping mechanism. In
particular, the proposed frame skipping adopts a uniform sampling approach by
dividing the original video into video clips of fixed size. By doing so, every
nth frame of the clip is selected to ensure that the temporal patterns can
easily be perceived during the training of three different recurrent neural
networks (RNNs). Motivated by the performance of individual RNNs, a meta-model
is developed to improve the overall detection performance by combining the
prediction of individual RNNs. Extensive experiments were performed on four
datasets, and state-of-the-art performance is reported on MSU-MFSD (3.12%),
Replay-Attack (11.19%), and OULU-NPU (12.23%) databases by using half total
error rates (HTERs) in the most challenging cross-dataset testing scenario.
- Abstract(参考訳): 顔提示攻撃 (PA) は、スプーフィング攻撃(英語版)としても知られ、アクセス制御システム、モバイル支払い、身元確認システムなど、顔認識システムに依存する生体認証システムに重大な脅威をもたらす。
スプーフィングリスクを軽減するために、連続するビデオフレームにおける顔の動きを分析するいくつかのビデオベースの手法が文献で紹介されている。
しかし、隣接するフレーム間の動きを推定することは困難であり、計算コストが高い。
本稿では,顔のスプーフィング防止タスクを動作予測問題として再現し,フレームスキップ機構を備えた深層アンサンブル学習モデルを提案する。
特に,提案したフレームスキップは,オリジナル映像を固定サイズのビデオクリップに分割することで一様サンプリング方式を採用する。
これにより、クリップのすべてのnフレームが選択され、3つの異なるリカレントニューラルネットワーク(RNN)のトレーニング中に、時間パターンが容易に認識できるようにする。
個々のRNNの性能に動機づけられたメタモデルは、個々のRNNの予測を組み合わせることで全体的な検出性能を向上させる。
4つのデータセットで広範な実験が行われ、msu-mfsd(3.12%)、replay-attack(11.19%)、oulu-npu(12.23%)データベースにおいて、最も困難なクロスデータセットテストシナリオで半分のエラーレート(hter)を使用して最新性能が報告された。
関連論文リスト
- UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - Patch Spatio-Temporal Relation Prediction for Video Anomaly Detection [19.643936110623653]
ビデオ異常検出(VAD)は、特定のコンテキストと時間枠内の異常を識別することを目的としている。
近年の深層学習に基づくVADモデルは,高解像度フレームの生成によって有望な結果を示した。
本稿では, パッチ間関係予測タスクを通じて, VADの自己教師型学習手法を提案する。
論文 参考訳(メタデータ) (2024-03-28T03:07:16Z) - Face Anti-Spoofing from the Perspective of Data Sampling [0.342658286826597]
顔提示攻撃検出は、デジタルデバイスに安全な顔アクセスを提供する上で重要な役割を果たす。
既存のビデオベースのPAD対策には、ビデオの長時間の時間変動に対処する能力がない。
本稿では,ガウス重み関数に基づく長距離時間変動をモデル化したビデオ処理方式を提案する。
論文 参考訳(メタデータ) (2022-08-28T07:54:30Z) - NSNet: Non-saliency Suppression Sampler for Efficient Video Recognition [89.84188594758588]
非定常フレームの応答を抑制するために, NSNet(Non-Sliency Suppression Network)を提案する。
NSNetは最先端の精度効率トレードオフを実現し、最先端の手法よりもはるかに高速な2.44.3xの実用的な推論速度を示す。
論文 参考訳(メタデータ) (2022-07-21T09:41:22Z) - Shuffled Patch-Wise Supervision for Presentation Attack Detection [12.031796234206135]
顔の偽造防止は、写真、ビデオ、マスク、または認証された人の顔の別の代用品を使用することによって、偽の顔認証を防止するために不可欠である。
ほとんどのプレゼンテーションアタック検出システムはオーバーフィッティングに悩まされており、1つのデータセットでほぼ完璧なスコアを得るが、より現実的なデータを持つ別のデータセットでは失敗する。
画素単位のバイナリ管理とパッチベースのCNNを組み合わせた新しいPAD手法を提案する。
論文 参考訳(メタデータ) (2021-09-08T08:14:13Z) - Frame-rate Up-conversion Detection Based on Convolutional Neural Network
for Learning Spatiotemporal Features [7.895528973776606]
本稿では、FRUCによる法医学的特徴をエンドツーエンドに学習するフレームレート変換検出ネットワーク(FCDNet)を提案する。
FCDNetは連続するフレームのスタックを入力として使用し、ネットワークブロックを使ってアーティファクトを効果的に学習して特徴を学習する。
論文 参考訳(メタデータ) (2021-03-25T08:47:46Z) - Aurora Guard: Reliable Face Anti-Spoofing via Mobile Lighting System [103.5604680001633]
紙写真やデジタルビデオの高解像度レンダリングリプレイに対する反偽造は、未解決の問題だ。
オーロラガード(Aurora Guard, AG)と呼ばれる, シンプルだが効果的な顔保護システムを提案する。
論文 参考訳(メタデータ) (2021-02-01T09:17:18Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z) - Sharp Multiple Instance Learning for DeepFake Video Detection [54.12548421282696]
我々はDeepFakeビデオに、ビデオレベルのラベルのみを提供するが、フェイクビデオのすべての顔が操作されるわけではない部分的な顔攻撃という新しい問題を導入する。
インスタンス埋め込みからバッグ予測への直接マッピングを構築する鋭いMIL(S-MIL)を提案する。
FFPMSと広く使われているDFDCデータセットの実験により、S-MILは部分的に攻撃されたDeepFakeビデオ検出において他の手法よりも優れていることが確認された。
論文 参考訳(メタデータ) (2020-08-11T08:52:17Z) - Uncertainty-Aware Weakly Supervised Action Detection from Untrimmed
Videos [82.02074241700728]
本稿では,ビデオフレームラベルのみを用いてトレーニングした,禁止レベルの行動認識モデルを提案する。
人1人当たりの手法は、複数のインスタンス学習フレームワーク内の大規模な画像データセットで訓練されている。
標準的な多重インスタンス学習の仮定では、各バッグには、指定されたラベルを持つ少なくとも1つのインスタンスが含まれているという仮定が無効である場合、どのようにメソッドを適用するかを示す。
論文 参考訳(メタデータ) (2020-07-21T10:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。