論文の概要: A 3D GAN for Improved Large-pose Facial Recognition
- arxiv url: http://arxiv.org/abs/2012.10545v2
- Date: Wed, 31 Mar 2021 10:32:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:09:22.672120
- Title: A 3D GAN for Improved Large-pose Facial Recognition
- Title(参考訳): 大規模顔認識のための3次元GAN
- Authors: Richard T. Marriott, Sami Romdhani and Liming Chen
- Abstract要約: 深層畳み込みニューラルネットワークを用いた顔認識は、顔画像の大きなデータセットの可用性に依存している。
近年の研究では、アイデンティティからポーズを離す方法が不十分であることが示されている。
本研究では,GAN発生器に3次元モーフィラブルモデルを組み込むことにより,野生画像から非線形テクスチャモデルを学習する。
これにより、新しい合成IDの生成と、アイデンティティを損なうことなくポーズ、照明、表現の操作が可能になります。
- 参考スコア(独自算出の注目度): 3.791440300377753
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial recognition using deep convolutional neural networks relies on the
availability of large datasets of face images. Many examples of identities are
needed, and for each identity, a large variety of images are needed in order
for the network to learn robustness to intra-class variation. In practice, such
datasets are difficult to obtain, particularly those containing adequate
variation of pose. Generative Adversarial Networks (GANs) provide a potential
solution to this problem due to their ability to generate realistic, synthetic
images. However, recent studies have shown that current methods of
disentangling pose from identity are inadequate. In this work we incorporate a
3D morphable model into the generator of a GAN in order to learn a nonlinear
texture model from in-the-wild images. This allows generation of new, synthetic
identities, and manipulation of pose, illumination and expression without
compromising the identity. Our synthesised data is used to augment training of
facial recognition networks with performance evaluated on the challenging CFP
and CPLFW datasets.
- Abstract(参考訳): 深層畳み込みニューラルネットワークを用いた顔認識は、顔画像の大きなデータセットの可用性に依存している。
アイデンティティの多くの例が必要であり、各アイデンティティに対して、ネットワークがクラス内変動に対する堅牢性を学ぶために、さまざまな画像が必要である。
実際には、このようなデータセットは、特に適切なポーズのバリエーションを含むデータセットを得るのが困難である。
GAN(Generative Adversarial Networks)は、現実的な合成画像を生成する能力により、この問題に対する潜在的な解決策を提供する。
しかし、近年の研究では、アイデンティティからポーズを離す方法が不十分であることが示されている。
本研究では,ganの生成器に3次元モーファブルモデルを導入して,野生画像から非線形テクスチャモデルを学ぶ。
これにより、新しい合成アイデンティティの生成とポーズ、照明、表現の操作が、アイデンティティを損なうことなく可能になる。
我々の合成データは,CFPデータセットとCPLFWデータセットの性能評価により,顔認識ネットワークのトレーニング強化に使用される。
関連論文リスト
- Alleviating Catastrophic Forgetting in Facial Expression Recognition with Emotion-Centered Models [49.3179290313959]
感情中心型生成的リプレイ (ECgr) は, 生成的対向ネットワークから合成画像を統合することで, この課題に対処する。
ECgrは、生成された画像の忠実性を保証するために品質保証アルゴリズムを組み込んでいる。
4つの多様な表情データセットに対する実験結果から,擬似リハーサル法により生成されたイメージを組み込むことで,ターゲットとするデータセットとソースデータセットのトレーニングが促進されることが示された。
論文 参考訳(メタデータ) (2024-04-18T15:28:34Z) - NeRFInvertor: High Fidelity NeRF-GAN Inversion for Single-shot Real
Image Animation [66.0838349951456]
Nerfベースの生成モデルは、一貫した3次元幾何で高品質な画像を生成する能力を示している。
本研究では,このNeRF-GANモデルを外科的に微調整し,実物体の高忠実度アニメーションを単一画像のみで実現するための普遍的手法を提案する。
論文 参考訳(メタデータ) (2022-11-30T18:36:45Z) - 3DMM-RF: Convolutional Radiance Fields for 3D Face Modeling [111.98096975078158]
本稿では,1つのパスを1つのパスで合成し,必要なニューラルネットワークのレンダリングサンプルのみを合成するスタイルベースの生成ネットワークを提案する。
このモデルは、任意のポーズと照明の顔画像に正確に適合し、顔の特徴を抽出し、制御可能な条件下で顔を再レンダリングするために使用できることを示す。
論文 参考訳(メタデータ) (2022-09-15T15:28:45Z) - Detecting High-Quality GAN-Generated Face Images using Neural Networks [23.388645531702597]
本稿では,スペクトル帯域差を利用したGAN生成画像と実画像との区別手法を提案する。
特に,クロスバンド共起行列と空間共起行列を用いて,顔画像のデジタル保存を可能にする。
性能向上は特に重要であり、異なる後処理環境において92%以上を達成することを示す。
論文 参考訳(メタデータ) (2022-03-03T13:53:27Z) - Methodology for Building Synthetic Datasets with Virtual Humans [1.5556923898855324]
大規模なデータセットは、ディープニューラルネットワークの改善、ターゲットトレーニングに使用することができる。
特に,100の合成IDからなるデータセットにまたがる複数の2次元画像のレンダリングに3次元形態素顔モデルを用いる。
論文 参考訳(メタデータ) (2020-06-21T10:29:36Z) - VAE/WGAN-Based Image Representation Learning For Pose-Preserving
Seamless Identity Replacement In Facial Images [15.855376604558977]
We present a novel variational generative adversarial network (VGAN) based on Wasserstein loss。
我々のネットワークは、ポーズ保存されたアイデンティティ・モーフィングとアイデンティティ保存されたポーズ・モーフィングの実行に利用できることを示す。
論文 参考訳(メタデータ) (2020-03-02T03:35:59Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z) - Using Simulated Data to Generate Images of Climate Change [108.43373369198765]
シミュレーションされた3次元環境からの画像を用いて,MUNITアーキテクチャによるドメイン適応タスクを改善する可能性について検討する。
気候変動の潜在的な影響に対する認識を高めるために、得られた画像を利用することを目指しています。
論文 参考訳(メタデータ) (2020-01-26T22:19:13Z) - Fine-grained Image-to-Image Transformation towards Visual Recognition [102.51124181873101]
我々は,入力画像の同一性を保った画像を生成するために,微細なカテゴリで画像を変換することを目的としている。
我々は、画像のアイデンティティと非関連要因をアンハングルするために、生成的敵ネットワークに基づくモデルを採用する。
CompCarsとMulti-PIEデータセットの実験では、我々のモデルが生成した画像のアイデンティティを、最先端の画像-画像変換モデルよりもはるかによく保存していることが示された。
論文 参考訳(メタデータ) (2020-01-12T05:26:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。