論文の概要: TransRPPG: Remote Photoplethysmography Transformer for 3D Mask Face
Presentation Attack Detection
- arxiv url: http://arxiv.org/abs/2104.07419v1
- Date: Thu, 15 Apr 2021 12:33:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 23:18:56.255687
- Title: TransRPPG: Remote Photoplethysmography Transformer for 3D Mask Face
Presentation Attack Detection
- Title(参考訳): TransRPPG:3次元マスク顔提示検出用リモート光胸像変換器
- Authors: Zitong Yu, Xiaobai Li, Pichao Wang, Guoying Zhao
- Abstract要約: 3次元マスク提示攻撃検出(PAD)は、3次元マスク攻撃から顔認識システムを保護する上で重要な役割を担っている。
ライブ本質表現を効率的に学習するための純粋なrトランス(TransR)フレームワークを提案する。
当社のTransRは軽量で効率的(547Kパラメータと763MOPのみ)で、モバイルレベルのアプリケーションに期待できる。
- 参考スコア(独自算出の注目度): 53.98866801690342
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: 3D mask face presentation attack detection (PAD) plays a vital role in
securing face recognition systems from emergent 3D mask attacks. Recently,
remote photoplethysmography (rPPG) has been developed as an intrinsic liveness
clue for 3D mask PAD without relying on the mask appearance. However, the rPPG
features for 3D mask PAD are still needed expert knowledge to design manually,
which limits its further progress in the deep learning and big data era. In
this letter, we propose a pure rPPG transformer (TransRPPG) framework for
learning intrinsic liveness representation efficiently. At first, rPPG-based
multi-scale spatial-temporal maps (MSTmap) are constructed from facial skin and
background regions. Then the transformer fully mines the global relationship
within MSTmaps for liveness representation, and gives a binary prediction for
3D mask detection. Comprehensive experiments are conducted on two benchmark
datasets to demonstrate the efficacy of the TransRPPG on both intra- and
cross-dataset testings. Our TransRPPG is lightweight and efficient (with only
547K parameters and 763M FLOPs), which is promising for mobile-level
applications.
- Abstract(参考訳): 3Dマスク提示攻撃検出(PAD)は、3Dマスク攻撃から顔認識システムを保護する上で重要な役割を果たす。
近年, リモートフォトプレチモグラフィ (rppg) は, マスクの外観に頼らずに, 3dマスクパッドに内在するライブネス手がかりとして開発されている。
しかし、3DマスクPADのrPPG機能は、手作業で設計する専門家の知識を必要とするため、ディープラーニングとビッグデータ時代のさらなる進歩は制限されている。
本稿では,本文において本文の生長表現を効率よく学習するための純rPPG変換器(TransRPPG)フレームワークを提案する。
まず、rPPGに基づくマルチスケール空間時間マップ(MSTmap)を顔の皮膚と背景領域から構築する。
そして, この変換器は, MSTマップ内の生長表現のグローバルな関係を完全にマイニングし, 3次元マスク検出のバイナリ予測を行う。
総合的な実験を2つのベンチマークデータセットで行い、transrppgがデータセット内テストとデータセット横断テストの両方に有効であることを示す。
当社のTransRPPGは軽量で効率的(547Kパラメータと763M FLOPのみ)で、モバイルレベルのアプリケーションには有望です。
関連論文リスト
- Triple Point Masking [49.39218611030084]
既存の3Dマスク学習手法は、限られたデータの下でパフォーマンスボトルネックに遭遇する。
我々は、マスク付きオートエンコーダの事前学習のためのスケーラブルなフレームワークとして、TPMと呼ばれるトリプルポイントマスキング方式を導入する。
大規模な実験により,提案したTPMを組み込んだ4つのベースラインが,下流タスクの総合的な性能向上を実現することが示された。
論文 参考訳(メタデータ) (2024-09-26T05:33:30Z) - A transfer learning approach with convolutional neural network for Face
Mask Detection [0.30693357740321775]
本稿では,トランスファー学習とインセプションv3アーキテクチャに基づくマスク認識システムを提案する。
マスクやマスクのない顔に加えて、マスクの誤用も検出できる。
論文 参考訳(メタデータ) (2023-10-29T07:38:33Z) - Flow-Attention-based Spatio-Temporal Aggregation Network for 3D Mask
Detection [12.160085404239446]
本稿では,FASTENと呼ばれる新しい3次元マスク検出フレームワークを提案する。
ネットワークが大きな動きの細部に集中するように調整することで、余分な時間的特徴干渉を排除できる。
FASTENは5フレームの入力しか必要とせず、データ内評価とクロスデータセット評価の両方で8つの競合より優れている。
論文 参考訳(メタデータ) (2023-10-25T11:54:21Z) - Masked Motion Predictors are Strong 3D Action Representation Learners [143.9677635274393]
人間の3次元行動認識では、教師付きデータが限られており、トランスフォーマーのような強力なネットワークのモデリング能力を十分に活用することは困難である。
人間の関節において、マスク付き自己成分再構成を行うための一般的な前提に従わず、明示的な文脈運動モデリングが、3次元動作認識のための効果的な特徴表現の学習の成功の鍵となることを示す。
論文 参考訳(メタデータ) (2023-08-14T11:56:39Z) - Mask Attack Detection Using Vascular-weighted Motion-robust rPPG Signals [21.884783786547782]
R-based face anti-spoofing method は、しばしばビデオシーケンスの不安定な顔アライメントによる性能劣化に悩まされる。
SIFTキーポイントと顔ランドマークの両方を用いて, 顔の鮮明かつ正確に画素レベルで整列するランドマークアンコール顔縫合法を提案する。
Gated Recurrent Unit (GRU) を備えた軽量なEfficientNetは、分類のための空間的特徴と時間的特徴の両方を抽出するように設計されている。
論文 参考訳(メタデータ) (2023-05-25T11:22:17Z) - Total Scale: Face-to-Body Detail Reconstruction from Sparse RGBD Sensors [52.38220261632204]
PIFuをベースとした再建術では, 顔面の平坦化が頻発する。
再建した顔のディテールの質を高めるために,2段階のPIFu表現を提案する。
顔の鮮明な細部と身体形状の変形におけるアプローチの有効性を実験的に検証した。
論文 参考訳(メタデータ) (2021-12-03T18:46:49Z) - Contrastive Context-Aware Learning for 3D High-Fidelity Mask Face
Presentation Attack Detection [103.7264459186552]
顔認識システムには、顔提示攻撃検出(PAD)が不可欠である。
ほとんどの既存の3DマスクPADベンチマークにはいくつかの欠点があります。
現実世界のアプリケーションとのギャップを埋めるために、大規模なハイファイアリティマスクデータセットを紹介します。
論文 参考訳(メタデータ) (2021-04-13T12:48:38Z) - A 3D model-based approach for fitting masks to faces in the wild [9.958467179573235]
マスクされた顔に対する様々なポーズの顔画像を増やすために,WearMask3Dと呼ばれる3次元モデルに基づくアプローチを提案する。
提案手法は,まず入力画像に3D形態素モデルを適用し,マスク表面を顔モデルにオーバーレイし,各マスクテクスチャをワープし,最後に3Dマスクを2Dに投影することで進行する。
実験の結果,wearmask3dはよりリアルなマスク画像を生成することを示し,これらの画像を用いたトレーニングによりマスク顔の認識精度が向上した。
論文 参考訳(メタデータ) (2021-03-01T06:50:18Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。