論文の概要: Deep Learning-based Single Image Face Depth Data Enhancement
- arxiv url: http://arxiv.org/abs/2006.11091v3
- Date: Tue, 27 Jul 2021 09:09:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 04:50:51.555000
- Title: Deep Learning-based Single Image Face Depth Data Enhancement
- Title(参考訳): 深層学習に基づく単一顔深度データ強調
- Authors: Torsten Schlett, Christian Rathgeb, Christoph Busch
- Abstract要約: 本研究は,この文脈における深層学習顔深度向上手法を提案する。
ディープラーニングエンハンサーは、テスト済みの既存のエンハンサーよりも顕著に優れた結果が得られる。
- 参考スコア(独自算出の注目度): 15.41435352543715
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face recognition can benefit from the utilization of depth data captured
using low-cost cameras, in particular for presentation attack detection
purposes. Depth video output from these capture devices can however contain
defects such as holes or general depth inaccuracies. This work proposes a deep
learning face depth enhancement method in this context of facial biometrics,
which adds a security aspect to the topic. U-Net-like architectures are
utilized, and the networks are compared against hand-crafted enhancer types, as
well as a similar depth enhancer network from related work trained for an
adjacent application scenario. All tested enhancer types exclusively use depth
data as input, which differs from methods that enhance depth based on
additional input data such as visible light color images. Synthetic face depth
ground truth images and degraded forms thereof are created with help of PRNet,
to train multiple deep learning enhancer models with different network sizes
and training configurations. Evaluations are carried out on the synthetic data,
on Kinect v1 images from the KinectFaceDB, and on in-house RealSense D435
images. These evaluations include an assessment of the falsification for
occluded face depth input, which is relevant to biometric security. The
proposed deep learning enhancers yield noticeably better results than the
tested preexisting enhancers, without overly falsifying depth data when
non-face input is provided, and are shown to reduce the error of a simple
landmark-based PAD method.
- Abstract(参考訳): 顔認識は、低コストのカメラで捉えた深度データの利用、特にプレゼンテーション攻撃検出の目的で有効である。
しかし、これらのキャプチャー装置から出力される深度ビデオは、ホールや一般的な深さ不正確な欠陥を含むことができる。
本研究は、顔バイオメトリックスという文脈において、そのトピックにセキュリティ的な側面を付加した、ディープラーニングによる顔深層強調手法を提案する。
U-Netのようなアーキテクチャが利用され、ネットワークは手作りのエンハンサータイプや、隣接するアプリケーションシナリオのために訓練された関連する作業からの類似のディープエンハンサーネットワークと比較される。
テスト対象のエンハンサーはいずれも深度データを入力として使用しており、可視光色画像などの追加入力データに基づいて深度を強化する方法とは異なる。
PRNetの助けを借りて合成顔深度地上真実画像とその劣化形態を作成し、異なるネットワークサイズとトレーニング構成で複数のディープラーニングエンハンサーモデルを訓練する。
合成データ,KinectFaceDBのKinect v1画像,および社内のRealSense D435画像を用いて評価を行った。
これらの評価には,生体認証に関係のある隠蔽顔深度入力に対するファルシフィケーションの評価が含まれる。
提案するディープラーニングエンハンサーは,非面入力時の奥行きデータを過度に改ざんすることなく,既存のエンハンサーよりも顕著に優れた結果が得られるとともに,簡易なランドマークベースパッド方式の誤差を低減できることを示す。
関連論文リスト
- Robust Depth Enhancement via Polarization Prompt Fusion Tuning [112.88371907047396]
様々な深度センサによる不正確な深度測定を改善するために偏光イメージングを利用するフレームワークを提案する。
まず、偏光データとセンサ深度マップから高密度で完全な深度マップを推定するために、ニューラルネットワークを訓練した学習ベースの戦略を採用する。
大規模データセット上で事前学習したRGBモデルを有効に活用するためのPPFT(Polarization Prompt Fusion Tuning)戦略を提案する。
論文 参考訳(メタデータ) (2024-04-05T17:55:33Z) - Depth Map Denoising Network and Lightweight Fusion Network for Enhanced
3D Face Recognition [61.27785140017464]
本稿では,ノイズを低減するために,DIIF(Denoising Implicit Image Function)に基づくDMDNet(Depth Map Denoising Network)を提案する。
さらに,光深度と標準核融合ネットワーク(LDNFNet)と呼ばれる強力な認識ネットワークを設計し,異なるモード間の特徴と相補的特徴を学習する。
論文 参考訳(メタデータ) (2024-01-01T10:46:42Z) - DeepFidelity: Perceptual Forgery Fidelity Assessment for Deepfake
Detection [67.3143177137102]
ディープフェイク検出(Deepfake detection)とは、画像やビデオにおいて、人工的に生成された顔や編集された顔を検出すること。
本稿では,実顔と偽顔とを適応的に識別するDeepFidelityという新しいDeepfake検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-07T07:19:45Z) - Exploring Depth Information for Face Manipulation Detection [25.01910127502075]
RGB顔画像からのパッチにより顔深度マップパッチを推定するための顔深度マップ変換器(FDMT)を提案する。
次に、推定された顔深度マップを、バックボーンの特徴と統合される補助情報とみなす。
論文 参考訳(メタデータ) (2022-12-29T09:00:22Z) - Deep Convolutional Pooling Transformer for Deepfake Detection [54.10864860009834]
本研究では,局所的・グローバル的に決定的な画像特徴を取り入れた深部畳み込み変換器を提案する。
具体的には,抽出した特徴を充実させ,有効性を高めるために,畳み込みプーリングと再アテンションを適用した。
提案手法は、内部実験と相互データセット実験の両方において、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2022-09-12T15:05:41Z) - End-to-end Learning for Joint Depth and Image Reconstruction from
Diffracted Rotation [10.896567381206715]
回折回転から深度を学習する新しいエンド・ツー・エンド学習手法を提案する。
提案手法は, 単分子深度推定のタスクにおいて既存の手法よりもはるかに少ない複雑なモデルと少ないトレーニングデータを必要とする。
論文 参考訳(メタデータ) (2022-04-14T16:14:37Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - Dual Pixel Exploration: Simultaneous Depth Estimation and Image
Restoration [77.1056200937214]
本研究では,ぼかしと深度情報をリンクするDPペアの形成について検討する。
本稿では,画像の深さを共同で推定し,復元するためのエンドツーエンドDDDNet(DPベースのDepth and De Network)を提案する。
論文 参考訳(メタデータ) (2020-12-01T06:53:57Z) - SAFENet: Self-Supervised Monocular Depth Estimation with Semantic-Aware
Feature Extraction [27.750031877854717]
本稿では,セマンティック情報を活用して光度損失の限界を克服するSAFENetを提案する。
私たちのキーとなるアイデアは、意味的知識と幾何学的知識を統合するセマンティック・アウェア・ディープ機能を活用することです。
KITTIデータセットの実験では、我々の手法が最先端の手法と競合するか、さらに優れています。
論文 参考訳(メタデータ) (2020-10-06T17:22:25Z) - Do We Need Depth in State-Of-The-Art Face Authentication? [8.755493949976492]
本研究では,顔表面や深度マップを明示的に計算することなく,ステレオカメラシステムから顔を認識する新しい手法を提案する。
原顔ステレオ画像は、顔が抽出された画像の位置とともに、提案したCNNが認識タスクを改善することができる。
提案手法は,大規模ベンチマークにおいて,単一画像と明示的深度に基づく手法の両方に優れることを示した。
論文 参考訳(メタデータ) (2020-03-24T14:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。