論文の概要: High-Accuracy RGB-D Face Recognition via Segmentation-Aware Face Depth
Estimation and Mask-Guided Attention Network
- arxiv url: http://arxiv.org/abs/2112.11713v1
- Date: Wed, 22 Dec 2021 07:46:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 18:59:38.262453
- Title: High-Accuracy RGB-D Face Recognition via Segmentation-Aware Face Depth
Estimation and Mask-Guided Attention Network
- Title(参考訳): 分割認識による高精度RGB-D顔認識とマスク誘導注意ネットワーク
- Authors: Meng-Tzu Chiu, Hsun-Ying Cheng, Chien-Yi Wang, Shang-Hong Lai
- Abstract要約: ディープラーニングアプローチは、非常に大きな顔画像データセットでモデルをトレーニングすることで、極めて正確な顔認識を実現している。
大規模な2D顔画像データセットが利用可能であるのと異なり、大規模な3D顔データセットが公開されていない。
本稿では,RGB-D顔認識タスクを改善するための2つのCNNモデルを提案する。
- 参考スコア(独自算出の注目度): 16.50097148165777
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning approaches have achieved highly accurate face recognition by
training the models with very large face image datasets. Unlike the
availability of large 2D face image datasets, there is a lack of large 3D face
datasets available to the public. Existing public 3D face datasets were usually
collected with few subjects, leading to the over-fitting problem. This paper
proposes two CNN models to improve the RGB-D face recognition task. The first
is a segmentation-aware depth estimation network, called DepthNet, which
estimates depth maps from RGB face images by including semantic segmentation
information for more accurate face region localization. The other is a novel
mask-guided RGB-D face recognition model that contains an RGB recognition
branch, a depth map recognition branch, and an auxiliary segmentation mask
branch with a spatial attention module. Our DepthNet is used to augment a large
2D face image dataset to a large RGB-D face dataset, which is used for training
an accurate RGB-D face recognition model. Furthermore, the proposed mask-guided
RGB-D face recognition model can fully exploit the depth map and segmentation
mask information and is more robust against pose variation than previous
methods. Our experimental results show that DepthNet can produce more reliable
depth maps from face images with the segmentation mask. Our mask-guided face
recognition model outperforms state-of-the-art methods on several public 3D
face datasets.
- Abstract(参考訳): ディープラーニングアプローチは、非常に大きな顔画像データセットでモデルをトレーニングすることで、極めて正確な顔認識を実現している。
大規模な2D顔画像データセットが利用可能であるのと異なり、大規模な3D顔データセットが公開されていない。
既存の3d顔データセットは通常、ごく少数の被験者で収集され、過剰フィッティング問題を引き起こした。
本稿では,RGB-D顔認識タスクを改善するための2つのCNNモデルを提案する。
1つ目はDepthNetと呼ばれるセグメンテーション対応深度推定ネットワークで、より正確な顔領域のローカライゼーションのためのセグメンテーション情報を含むRGBの顔画像から深度マップを推定する。
もう1つは、rgb認識ブランチ、深度マップ認識ブランチ、空間注意モジュールを備えた補助セグメンテーションマスクブランチを含む、新しいマスク誘導型rgb-d顔認識モデルである。
我々のDepthNetは、大きな2次元顔画像データセットを大きなRGB-D顔データセットに拡張するために使用され、正確なRGB-D顔認識モデルのトレーニングに使用される。
さらに,提案するマスク誘導型rgb-d顔認識モデルでは,深度マップとセグメンテーションマスク情報を十分に活用でき,従来の手法よりもポーズ変動に対して頑健である。
実験結果から,DepthNetは分割マスクを用いた顔画像からより信頼性の高い深度マップを作成できることがわかった。
マスク誘導顔認識モデルは、いくつかの公開3次元顔データセットにおいて最先端の手法より優れている。
関連論文リスト
- Depth-based Privileged Information for Boosting 3D Human Pose Estimation on RGB [48.31210455404533]
ヒートマップに基づく3Dポーズ推定器は、推定時に与えられるRGBフレームから深度情報を幻覚することができる。
深度情報は、RGBベースの幻覚ネットワークを強制して、深度データのみに基づいて事前訓練されたバックボーンに類似した特徴を学習することによって、トレーニング中にのみ使用される。
論文 参考訳(メタデータ) (2024-09-17T11:59:34Z) - Improving 2D face recognition via fine-level facial depth generation and
RGB-D complementary feature learning [0.8223798883838329]
顔深度生成ネットワークと改良されたマルチモーダル補完特徴学習ネットワークを提案する。
Lock3DFaceデータセットとIIIT-Dデータセットの実験は、提案したFFDGNetとI MCFLNetがRGB-D顔認識の精度を向上させることを示した。
論文 参考訳(メタデータ) (2023-05-08T02:33:59Z) - Generating 2D and 3D Master Faces for Dictionary Attacks with a
Network-Assisted Latent Space Evolution [68.8204255655161]
マスターフェイス(英: master face)とは、人口の比率の高い顔認証をパスする顔画像である。
2次元および3次元の顔認証モデルに対して,これらの顔の最適化を行う。
3Dでは,2次元スタイルGAN2ジェネレータを用いて顔を生成し,深部3次元顔再構成ネットワークを用いて3次元構造を予測する。
論文 参考訳(メタデータ) (2022-11-25T09:15:38Z) - Layered Depth Refinement with Mask Guidance [61.10654666344419]
汎用マスクを用いてSIDEモデルの深度予測を洗練させるマスク誘導深度改善の新しい問題を定式化する。
本フレームワークは,奥行きマップをマスクと逆マスクで表される2つの別々の層に分解し,層状改質・塗装・塗装を行う。
本手法は,内面境界領域と外面境界領域の深度を正確に補正し,異なる種類のマスクや初期深度予測に対して堅牢であることを示す。
論文 参考訳(メタデータ) (2022-06-07T06:42:44Z) - Total Scale: Face-to-Body Detail Reconstruction from Sparse RGBD Sensors [52.38220261632204]
PIFuをベースとした再建術では, 顔面の平坦化が頻発する。
再建した顔のディテールの質を高めるために,2段階のPIFu表現を提案する。
顔の鮮明な細部と身体形状の変形におけるアプローチの有効性を実験的に検証した。
論文 参考訳(メタデータ) (2021-12-03T18:46:49Z) - Facial Depth and Normal Estimation using Single Dual-Pixel Camera [81.02680586859105]
DP指向のDepth/Normalネットワークを導入し,3次元顔形状を再構成する。
これは、メートル法スケールでの深度マップと表面正規を含む、対応する地上3次元モデルを含んでいる。
近年のDPベース深度/正規推定法で最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-11-25T05:59:27Z) - Depth as Attention for Face Representation Learning [11.885178256393893]
低コストRGB-Dセンサを用いた深度マルチモーダル顔認識のための新しい深度誘導型注意メカニズムを提案する。
この解は, 4つのデータセットに対して平均87.3% (+5.0%), 99.1% (+0.9%), 99.7% (+0.6%) および95.3% (+0.5%) の精度を達成する。
論文 参考訳(メタデータ) (2021-01-03T16:19:34Z) - Reconstructing A Large Scale 3D Face Dataset for Deep 3D Face
Identification [9.159921061636695]
本稿では,2次元支援型深部3次元顔認証の枠組みを提案する。
特に,大規模な2次元顔データベースから数百万の3次元顔スキャンを再構築することを提案する。
提案手法はFRGC v2.0, Bosphorus, BU-3DFEの3次元顔データベース上で, 最先端のランク1スコアを実現する。
論文 参考訳(メタデータ) (2020-10-16T13:48:38Z) - Multi-channel Deep 3D Face Recognition [4.726009758066045]
2次元顔認証の精度は、ポーズ、照明、メイクアップ、表情の変化によって依然として疑問視されている。
本稿では,3次元顔データに基づく顔認識のためのマルチチャネルディープ3次元顔ネットワークを提案する。
マルチチャネル深部3次元顔ネットワークの顔認識精度は98.6。
論文 参考訳(メタデータ) (2020-09-30T15:29:05Z) - Face Super-Resolution Guided by 3D Facial Priors [92.23902886737832]
シャープな顔構造を把握した3次元顔先行情報を明示的に組み込んだ新しい顔超解像法を提案する。
我々の研究は、顔属性のパラメトリック記述の融合に基づく3次元形態的知識を初めて探求したものである。
提案した3D先行画像は、最先端技術よりも優れた顔超解像結果が得られる。
論文 参考訳(メタデータ) (2020-07-18T15:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。