論文の概要: Flow-Attention-based Spatio-Temporal Aggregation Network for 3D Mask
Detection
- arxiv url: http://arxiv.org/abs/2310.16569v1
- Date: Wed, 25 Oct 2023 11:54:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 15:01:30.602773
- Title: Flow-Attention-based Spatio-Temporal Aggregation Network for 3D Mask
Detection
- Title(参考訳): フローアテンションに基づく3次元マスク検出のための時空間アグリゲーションネットワーク
- Authors: Yuxin Cao, Yian Li, Yumeng Zhu, Derui Wang, Minhui Xue
- Abstract要約: 本稿では,FASTENと呼ばれる新しい3次元マスク検出フレームワークを提案する。
ネットワークが大きな動きの細部に集中するように調整することで、余分な時間的特徴干渉を排除できる。
FASTENは5フレームの入力しか必要とせず、データ内評価とクロスデータセット評価の両方で8つの競合より優れている。
- 参考スコア(独自算出の注目度): 12.160085404239446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anti-spoofing detection has become a necessity for face recognition systems
due to the security threat posed by spoofing attacks. Despite great success in
traditional attacks, most deep-learning-based methods perform poorly in 3D
masks, which can highly simulate real faces in appearance and structure,
suffering generalizability insufficiency while focusing only on the spatial
domain with single frame input. This has been mitigated by the recent
introduction of a biomedical technology called rPPG (remote
photoplethysmography). However, rPPG-based methods are sensitive to noisy
interference and require at least one second (> 25 frames) of observation time,
which induces high computational overhead. To address these challenges, we
propose a novel 3D mask detection framework, called FASTEN
(Flow-Attention-based Spatio-Temporal aggrEgation Network). We tailor the
network for focusing more on fine-grained details in large movements, which can
eliminate redundant spatio-temporal feature interference and quickly capture
splicing traces of 3D masks in fewer frames. Our proposed network contains
three key modules: 1) a facial optical flow network to obtain non-RGB
inter-frame flow information; 2) flow attention to assign different
significance to each frame; 3) spatio-temporal aggregation to aggregate
high-level spatial features and temporal transition features. Through extensive
experiments, FASTEN only requires five frames of input and outperforms eight
competitors for both intra-dataset and cross-dataset evaluations in terms of
multiple detection metrics. Moreover, FASTEN has been deployed in real-world
mobile devices for practical 3D mask detection.
- Abstract(参考訳): スプーフィング検出は、スプーフィング攻撃によるセキュリティ上の脅威のために、顔認識システムにとって必須となっている。
従来の攻撃では大きな成功を収めたものの、ほとんどのディープラーニングベースの手法は3dマスクではパフォーマンスが悪く、外観や構造の実際の顔を高度にシミュレートでき、単一のフレーム入力で空間領域のみに焦点を合わせながら、汎用性に欠ける。
これは最近のrppg(remote photoplethysmography)と呼ばれるバイオメディカル技術の導入によって緩和された。
しかし、rPPGに基づく手法はノイズの多い干渉に敏感であり、観測時間の少なくとも1秒 (>25 フレーム) を必要とするため、高い計算オーバーヘッドが生じる。
これらの課題に対処するため,FASTEN(Flow-Atttention-based Spatio-Temporal aggrEgation Network)と呼ばれる新しい3次元マスク検出フレームワークを提案する。
これにより、余分な時空間的特徴干渉を排除し、3Dマスクのスプライシングトレースを少ないフレームで素早く捕捉することができる。
提案するネットワークには3つの重要なモジュールがある。
1) 非rgbフレーム間フロー情報を取得するための顔光フローネットワーク
2) 各フレームに異なる意味を付与する流れの注意
3) 高次空間特徴と時間遷移特徴を集約する時空間アグリゲーション。
広範な実験を通じて、FASTENは入力の5フレームしか必要とせず、複数の検出基準でデータセット内およびデータセット間の評価において8つの競合よりも優れている。
さらに、FASTENは実際の3Dマスク検出のために現実世界のモバイルデバイスにデプロイされている。
関連論文リスト
- M3FAS: An Accurate and Robust MultiModal Mobile Face Anti-Spoofing
System [36.90840562720965]
フェイスプレゼンテーションアタック(FPA)は、様々な悪意あるアプリケーションを通じて、公衆の懸念を高めている。
我々は、M3FASという、正確で堅牢なマルチモーダル・モバイル・フェイス・アンチ・スポーフィング・システムを考案し、上記の問題を克服した。
論文 参考訳(メタデータ) (2023-01-30T12:37:04Z) - Face Presentation Attack Detection [59.05779913403134]
顔認識技術は、チェックインやモバイル支払いといった日々の対話的アプリケーションで広く利用されている。
しかしながら、プレゼンテーションアタック(PA)に対する脆弱性は、超セキュアなアプリケーションシナリオにおける信頼性の高い使用を制限する。
論文 参考訳(メタデータ) (2022-12-07T14:51:17Z) - S^2-Transformer for Mask-Aware Hyperspectral Image Reconstruction [48.83280067393851]
代表的ハイパースペクトル画像取得手順は、符号化開口分光画像センサ(CASSI)による3D-to-2D符号化を行う
i) 2次元計測を得るために、CASSIは分散器タイトリングにより複数のチャネルを分散させ、それらを同じ空間領域に絞り込み、絡み合ったデータ損失をもたらす。
本稿では,これらの課題に対処するためのマスク対応学習戦略を備えた空間スペクトル(S2-)トランスフォーマーアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-09-24T19:26:46Z) - Mask or Non-Mask? Robust Face Mask Detector via Triplet-Consistency
Representation Learning [23.062034116854875]
新型コロナウイルスの感染拡大を遅らせる効果的な方法の1つは、ワクチンや薬品がない場合、マスクを着用することである。
公共の場でのマスクや覆いの使用を義務付けるには、面倒で注意が集中的な人的資源の追加が必要である。
本稿では,フィードフォワード畳み込みニューラルネットワークの効果的な注目を実現するために,コンテキストアテンションモジュールを用いたフェイスマスク検出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-01T16:44:06Z) - TransRPPG: Remote Photoplethysmography Transformer for 3D Mask Face
Presentation Attack Detection [53.98866801690342]
3次元マスク提示攻撃検出(PAD)は、3次元マスク攻撃から顔認識システムを保護する上で重要な役割を担っている。
ライブ本質表現を効率的に学習するための純粋なrトランス(TransR)フレームワークを提案する。
当社のTransRは軽量で効率的(547Kパラメータと763MOPのみ)で、モバイルレベルのアプリケーションに期待できる。
論文 参考訳(メタデータ) (2021-04-15T12:33:13Z) - Contrastive Context-Aware Learning for 3D High-Fidelity Mask Face
Presentation Attack Detection [103.7264459186552]
顔認識システムには、顔提示攻撃検出(PAD)が不可欠である。
ほとんどの既存の3DマスクPADベンチマークにはいくつかの欠点があります。
現実世界のアプリケーションとのギャップを埋めるために、大規模なハイファイアリティマスクデータセットを紹介します。
論文 参考訳(メタデータ) (2021-04-13T12:48:38Z) - Efficient Two-Stream Network for Violence Detection Using Separable
Convolutional LSTM [0.0]
Separable Convolutional LSTM(SepConvLSTM)と予め訓練されたMobileNetを活用した効率的な2ストリームディープラーニングアーキテクチャを提案する。
SepConvLSTMは、ConvLSTMの各ゲートの畳み込み操作を深さ方向に分離可能な畳み込みに置き換えて構築されます。
我々のモデルは、大きくて挑戦的なrwf-2000データセットの精度を2%以上上回っている。
論文 参考訳(メタデータ) (2021-02-21T12:01:48Z) - AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement
with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。
総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文 参考訳(メタデータ) (2020-04-26T05:43:21Z) - Deep Spatial Gradient and Temporal Depth Learning for Face Anti-spoofing [61.82466976737915]
深層学習は、顔の反偽造の最も効果的な方法の1つとして証明されている。
2つの洞察に基づいて,複数フレームからの提示攻撃を検出する新しい手法を提案する。
提案手法は,5つのベンチマークデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2020-03-18T06:11:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。