論文の概要: DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition
- arxiv url: http://arxiv.org/abs/2002.09859v1
- Date: Sun, 23 Feb 2020 08:16:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 09:46:34.363569
- Title: DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition
- Title(参考訳): DotFAN: ポーズ・照明不変顔認識のためのドメイン変換型顔拡張ネットワーク
- Authors: Hao-Chiang Shao, Kang-Yu Liu, Chia-Wen Lin, Jiwen Lu
- Abstract要約: 本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
- 参考スコア(独自算出の注目度): 94.96686189033869
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The performance of a convolutional neural network (CNN) based face
recognition model largely relies on the richness of labelled training data.
Collecting a training set with large variations of a face identity under
different poses and illumination changes, however, is very expensive, making
the diversity of within-class face images a critical issue in practice. In this
paper, we propose a 3D model-assisted domain-transferred face augmentation
network (DotFAN) that can generate a series of variants of an input face based
on the knowledge distilled from existing rich face datasets collected from
other domains. DotFAN is structurally a conditional CycleGAN but has two
additional subnetworks, namely face expert network (FEM) and face shape
regressor (FSR), for latent code control. While FSR aims to extract face
attributes, FEM is designed to capture a face identity. With their aid, DotFAN
can learn a disentangled face representation and effectively generate face
images of various facial attributes while preserving the identity of augmented
faces. Experiments show that DotFAN is beneficial for augmenting small face
datasets to improve their within-class diversity so that a better face
recognition model can be learned from the augmented dataset.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)に基づく顔認識モデルの性能は、ラベル付きトレーニングデータの豊かさに大きく依存している。
しかし、異なるポーズや照明変化の下で顔のアイデンティティに大きなバリエーションを持つトレーニングセットの収集は非常に高価であり、クラス内の顔画像の多様性が現実的に重要な問題となっている。
本稿では,他のドメインから収集した豊富な顔データセットから抽出した知識に基づいて,入力面の一連の変種を生成することができる3次元モデルを用いたドメイン転送顔拡張ネットワーク(DotFAN)を提案する。
DotFANは構造的には条件付きCycleGANであるが、遅延コード制御のための2つのサブネットワーク、すなわちface Expert Network(FEM)とface shape Regressor(FSR)がある。
FSRは顔の属性を抽出することを目的としているが、FEMは顔のアイデンティティをキャプチャするように設計されている。
その助けを借りて、DotFANは、切り離された顔の表現を学び、強化された顔のアイデンティティを保持しながら、様々な顔属性の顔画像を効果的に生成できる。
実験によれば、dotfanは小さな顔データセットの強化に役立ち、クラス内多様性を改善し、拡張データセットからより良い顔認識モデルを学ぶことができる。
関連論文リスト
- ID$^3$: Identity-Preserving-yet-Diversified Diffusion Models for Synthetic Face Recognition [60.15830516741776]
合成顔認識(SFR)は、実際の顔データの分布を模倣するデータセットを生成することを目的としている。
拡散燃料SFRモデルであるtextID3$を紹介します。
textID3$はID保存損失を利用して、多様だがアイデンティティに一貫性のある顔の外観を生成する。
論文 参考訳(メタデータ) (2024-09-26T06:46:40Z) - Face Transformer: Towards High Fidelity and Accurate Face Swapping [54.737909435708936]
Face swappingは、ソース顔の同一性とターゲット顔の属性を融合させるスワップ画像を生成することを目的としている。
本稿では,顔の同一性と対象属性を同時に正確に保存できる新しい顔交換ネットワークであるFace Transformerを提案する。
論文 参考訳(メタデータ) (2023-04-05T15:51:44Z) - FaceDancer: Pose- and Occlusion-Aware High Fidelity Face Swapping [62.38898610210771]
そこで我々は,FaceDancerという顔のスワップとID転送のための新しい単一ステージ手法を提案する。
アダプティブ・フィーチャー・フュージョン・アテンション(AFFA)と解釈的特徴類似性規則化(IFSR)の2つの主要なコントリビューションがある。
論文 参考訳(メタデータ) (2022-10-19T11:31:38Z) - Analyzing the Impact of Shape & Context on the Face Recognition
Performance of Deep Networks [2.0099255688059907]
顔画像におけるベースアイデンティティの基底となる3次元形状の変化が全体像を歪めるかを分析する。
本実験は, 正確な顔マッチングにおける顔形状の重要性を実証し, ネットワークトレーニングにおける文脈データの重要性を裏付けるものである。
論文 参考訳(メタデータ) (2022-08-05T05:32:07Z) - GMFIM: A Generative Mask-guided Facial Image Manipulation Model for
Privacy Preservation [0.7734726150561088]
入力顔画像に知覚不可能な編集を適用するために,GANをベースとしたマスク誘導顔画像マニピュレーションモデルを提案する。
我々のモデルは、最先端の手法と比較して、自動顔認識システムに対してより良い性能を実現することができる。
論文 参考訳(メタデータ) (2022-01-10T14:09:14Z) - FaceTuneGAN: Face Autoencoder for Convolutional Expression Transfer
Using Neural Generative Adversarial Networks [0.7043489166804575]
顔の識別と表情を分離して符号化する新しい3次元顔モデル表現であるFaceTuneGANを提案する。
本稿では,2次元領域で使用されている画像と画像の変換ネットワークを3次元顔形状に適応させる手法を提案する。
論文 参考訳(メタデータ) (2021-12-01T14:42:03Z) - Network Architecture Search for Face Enhancement [82.25775020564654]
我々は、NASFE(Network Architecture Search for Face Enhancement)と呼ばれるマルチタスクの顔復元ネットワークを提案する。
NASFEは、単一の劣化(すなわち)を含む低品質の顔画像を高めることができる。
ノイズまたはぼやけ)または複数の劣化(ノイズ+ブラル+ローライト)
論文 参考訳(メタデータ) (2021-05-13T19:46:05Z) - A 3D GAN for Improved Large-pose Facial Recognition [3.791440300377753]
深層畳み込みニューラルネットワークを用いた顔認識は、顔画像の大きなデータセットの可用性に依存している。
近年の研究では、アイデンティティからポーズを離す方法が不十分であることが示されている。
本研究では,GAN発生器に3次元モーフィラブルモデルを組み込むことにより,野生画像から非線形テクスチャモデルを学習する。
これにより、新しい合成IDの生成と、アイデンティティを損なうことなくポーズ、照明、表現の操作が可能になります。
論文 参考訳(メタデータ) (2020-12-18T22:41:15Z) - SuperFront: From Low-resolution to High-resolution Frontal Face
Synthesis [65.35922024067551]
本稿では,前頭前頭部を保存した高品質なアイデンティティを生成できるGANモデルを提案する。
具体的には,高分解能(HR)面を1対多のLR面から様々なポーズで合成するSuperFront-GANを提案する。
超高解像度のサイドビューモジュールをSF-GANに統合し、人事空間におけるアイデンティティ情報とサイドビューの詳細を保存します。
論文 参考訳(メタデータ) (2020-12-07T23:30:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。