Fugu-MT 論文翻訳(概要): Flow-Attention-based Spatio-Temporal Aggregation Network for 3D Mask Detection

論文の概要: Flow-Attention-based Spatio-Temporal Aggregation Network for 3D Mask Detection

arxiv url: http://arxiv.org/abs/2310.16569v1
Date: Wed, 25 Oct 2023 11:54:21 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-26 15:01:30.602773
Title: Flow-Attention-based Spatio-Temporal Aggregation Network for 3D Mask Detection
Title（参考訳）: フローアテンションに基づく3次元マスク検出のための時空間アグリゲーションネットワーク
Authors: Yuxin Cao, Yian Li, Yumeng Zhu, Derui Wang, Minhui Xue
Abstract要約: 本稿では,FASTENと呼ばれる新しい3次元マスク検出フレームワークを提案する。ネットワークが大きな動きの細部に集中するように調整することで、余分な時間的特徴干渉を排除できる。 FASTENは5フレームの入力しか必要とせず、データ内評価とクロスデータセット評価の両方で8つの競合より優れている。
参考スコア（独自算出の注目度）: 12.160085404239446
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Anti-spoofing detection has become a necessity for face recognition systems due to the security threat posed by spoofing attacks. Despite great success in traditional attacks, most deep-learning-based methods perform poorly in 3D masks, which can highly simulate real faces in appearance and structure, suffering generalizability insufficiency while focusing only on the spatial domain with single frame input. This has been mitigated by the recent introduction of a biomedical technology called rPPG (remote photoplethysmography). However, rPPG-based methods are sensitive to noisy interference and require at least one second (> 25 frames) of observation time, which induces high computational overhead. To address these challenges, we propose a novel 3D mask detection framework, called FASTEN (Flow-Attention-based Spatio-Temporal aggrEgation Network). We tailor the network for focusing more on fine-grained details in large movements, which can eliminate redundant spatio-temporal feature interference and quickly capture splicing traces of 3D masks in fewer frames. Our proposed network contains three key modules: 1) a facial optical flow network to obtain non-RGB inter-frame flow information; 2) flow attention to assign different significance to each frame; 3) spatio-temporal aggregation to aggregate high-level spatial features and temporal transition features. Through extensive experiments, FASTEN only requires five frames of input and outperforms eight competitors for both intra-dataset and cross-dataset evaluations in terms of multiple detection metrics. Moreover, FASTEN has been deployed in real-world mobile devices for practical 3D mask detection.
Abstract（参考訳）: スプーフィング検出は、スプーフィング攻撃によるセキュリティ上の脅威のために、顔認識システムにとって必須となっている。従来の攻撃では大きな成功を収めたものの、ほとんどのディープラーニングベースの手法は3dマスクではパフォーマンスが悪く、外観や構造の実際の顔を高度にシミュレートでき、単一のフレーム入力で空間領域のみに焦点を合わせながら、汎用性に欠ける。これは最近のrppg(remote photoplethysmography)と呼ばれるバイオメディカル技術の導入によって緩和された。しかし、rPPGに基づく手法はノイズの多い干渉に敏感であり、観測時間の少なくとも1秒 (>25 フレーム) を必要とするため、高い計算オーバーヘッドが生じる。これらの課題に対処するため,FASTEN(Flow-Atttention-based Spatio-Temporal aggrEgation Network)と呼ばれる新しい3次元マスク検出フレームワークを提案する。これにより、余分な時空間的特徴干渉を排除し、3Dマスクのスプライシングトレースを少ないフレームで素早く捕捉することができる。提案するネットワークには3つの重要なモジュールがある。 1) 非rgbフレーム間フロー情報を取得するための顔光フローネットワーク 2) 各フレームに異なる意味を付与する流れの注意 3) 高次空間特徴と時間遷移特徴を集約する時空間アグリゲーション。広範な実験を通じて、FASTENは入力の5フレームしか必要とせず、複数の検出基準でデータセット内およびデータセット間の評価において8つの競合よりも優れている。さらに、FASTENは実際の3Dマスク検出のために現実世界のモバイルデバイスにデプロイされている。

関連論文リスト

Learning Knowledge-based Prompts for Robust 3D Mask Presentation Attack Detection [84.21257150497254]
本稿では,3次元マスク提示攻撃検出のための視覚言語モデルの強力な一般化能力を検討するための,知識に基づく新しいプロンプト学習フレームワークを提案する。実験により,提案手法は最先端のシナリオ内およびクロスシナリオ検出性能を実現することを示す。
論文参考訳（メタデータ） (2025-05-06T15:09:23Z)
Dual-Domain Masked Image Modeling: A Self-Supervised Pretraining Strategy Using Spatial and Frequency Domain Masking for Hyperspectral Data [35.34526230299484]
本稿では,ラベルなしデータの大部分を利用するハイパースペクトルデータに対する自己教師付き事前学習戦略を提案する。本稿では,空間領域と周波数領域の両方で動作する新しい二重ドメインマスキング機構を提案する。提案手法を3つの公開HSI分類ベンチマークで評価し,現状の性能を実証した。
論文参考訳（メタデータ） (2025-05-06T06:24:21Z)
UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文参考訳（メタデータ） (2024-07-26T20:51:54Z)
FALCON: Frequency Adjoint Link with CONtinuous Density Mask for Fast Single Image Dehazing [8.703680337470285]
この研究は、品質と速度の両面で最先端の性能を達成するシングルイメージデハージングシステムであるFALCONを紹介する。本研究では, 連続密度マスクを用いた大気散乱モデルに基づいて, 基礎となるヘイズ分布を利用する。複数の最先端手法とアブレーション解析を含む実験は、FALCONの脱ハージング品質と速度の両方における異常な性能を実証している。
論文参考訳（メタデータ） (2024-07-01T05:16:26Z)
M3FAS: An Accurate and Robust MultiModal Mobile Face Anti-Spoofing System [39.37647248710612]
フェイスプレゼンテーションアタック(FPA)は、様々な悪意あるアプリケーションを通じて、公衆の懸念を高めている。我々は,M3FASという,正確で堅牢なマルチモーダル・モバイル・フェイス・アンチ・スポーフィングシステムを開発した。
論文参考訳（メタデータ） (2023-01-30T12:37:04Z)
S^2-Transformer for Mask-Aware Hyperspectral Image Reconstruction [48.83280067393851]
代表的ハイパースペクトル画像取得手順は、符号化開口分光画像センサ(CASSI)による3D-to-2D符号化を行う i) 2次元計測を得るために、CASSIは分散器タイトリングにより複数のチャネルを分散させ、それらを同じ空間領域に絞り込み、絡み合ったデータ損失をもたらす。本稿では,これらの課題に対処するためのマスク対応学習戦略を備えた空間スペクトル(S2-)トランスフォーマーアーキテクチャを提案する。
論文参考訳（メタデータ） (2022-09-24T19:26:46Z)
TransRPPG: Remote Photoplethysmography Transformer for 3D Mask Face Presentation Attack Detection [53.98866801690342]
3次元マスク提示攻撃検出(PAD)は、3次元マスク攻撃から顔認識システムを保護する上で重要な役割を担っている。ライブ本質表現を効率的に学習するための純粋なrトランス(TransR)フレームワークを提案する。当社のTransRは軽量で効率的(547Kパラメータと763MOPのみ)で、モバイルレベルのアプリケーションに期待できる。
論文参考訳（メタデータ） (2021-04-15T12:33:13Z)
Contrastive Context-Aware Learning for 3D High-Fidelity Mask Face Presentation Attack Detection [103.7264459186552]
顔認識システムには、顔提示攻撃検出(PAD)が不可欠である。ほとんどの既存の3DマスクPADベンチマークにはいくつかの欠点があります。現実世界のアプリケーションとのギャップを埋めるために、大規模なハイファイアリティマスクデータセットを紹介します。
論文参考訳（メタデータ） (2021-04-13T12:48:38Z)
Efficient Two-Stream Network for Violence Detection Using Separable Convolutional LSTM [0.0]
Separable Convolutional LSTM(SepConvLSTM)と予め訓練されたMobileNetを活用した効率的な2ストリームディープラーニングアーキテクチャを提案する。 SepConvLSTMは、ConvLSTMの各ゲートの畳み込み操作を深さ方向に分離可能な畳み込みに置き換えて構築されます。我々のモデルは、大きくて挑戦的なrwf-2000データセットの精度を2%以上上回っている。
論文参考訳（メタデータ） (2021-02-21T12:01:48Z)
AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文参考訳（メタデータ） (2020-04-26T05:43:21Z)
Deep Spatial Gradient and Temporal Depth Learning for Face Anti-spoofing [61.82466976737915]
深層学習は、顔の反偽造の最も効果的な方法の1つとして証明されている。 2つの洞察に基づいて,複数フレームからの提示攻撃を検出する新しい手法を提案する。提案手法は,5つのベンチマークデータセットの最先端結果を実現する。
論文参考訳（メタデータ） (2020-03-18T06:11:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。