論文の概要: MorphGAN: One-Shot Face Synthesis GAN for Detecting Recognition Bias
- arxiv url: http://arxiv.org/abs/2012.05225v2
- Date: Thu, 10 Dec 2020 18:48:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 02:17:02.335145
- Title: MorphGAN: One-Shot Face Synthesis GAN for Detecting Recognition Bias
- Title(参考訳): MorphGAN:認識バイアス検出のためのワンショット顔合成GAN
- Authors: Nataniel Ruiz, Barry-John Theobald, Anurag Ranjan, Ahmed Hussein
Abdelaziz, Nicholas Apostoloff
- Abstract要約: 本論文では, 頭部ポーズと表情調節を, 既視者の画像に適用するシミュレータについて述べる。
顔の小さなデータセットを新しいポーズと表現で拡張することで、増強やデータの不足に応じて、認識性能を最大9%向上することを示す。
- 参考スコア(独自算出の注目度): 13.162012586770576
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To detect bias in face recognition networks, it can be useful to probe a
network under test using samples in which only specific attributes vary in some
controlled way. However, capturing a sufficiently large dataset with specific
control over the attributes of interest is difficult. In this work, we describe
a simulator that applies specific head pose and facial expression adjustments
to images of previously unseen people. The simulator first fits a 3D morphable
model to a provided image, applies the desired head pose and facial expression
controls, then renders the model into an image. Next, a conditional Generative
Adversarial Network (GAN) conditioned on the original image and the rendered
morphable model is used to produce the image of the original person with the
new facial expression and head pose. We call this conditional GAN -- MorphGAN.
Images generated using MorphGAN conserve the identity of the person in the
original image, and the provided control over head pose and facial expression
allows test sets to be created to identify robustness issues of a facial
recognition deep network with respect to pose and expression. Images generated
by MorphGAN can also serve as data augmentation when training data are scarce.
We show that by augmenting small datasets of faces with new poses and
expressions improves the recognition performance by up to 9% depending on the
augmentation and data scarcity.
- Abstract(参考訳): 顔認証ネットワークのバイアスを検出するには,特定の属性のみが何らかの制御方法で異なるサンプルを用いて,テスト中のネットワークを探索することが有用である。
しかし、興味のある属性を特定の制御で十分に大きなデータセットを取得することは困難である。
本研究では,前例のない人物の画像に特定の頭部ポーズと表情調整を適用するシミュレータについて述べる。
シミュレータはまず、提供された画像に3Dモデルに適合し、所望の頭部ポーズと表情制御を適用し、その後モデルを画像にレンダリングする。
次に、原画像に条件付けされた条件付き生成反転ネットワーク(GAN)とレンダリング可能なモデルを用いて、新規な表情と頭部ポーズを有する原人物の画像を生成する。
この条件付き GAN を MorphGAN と呼ぶ。
MorphGANを用いて生成された画像は、原画像中の人物の身元を保存し、提供された頭部ポーズと表情に対する制御により、顔と表情に関する顔認識深層ネットワークの堅牢性問題を識別するためのテストセットを作成することができる。
MorphGANが生成した画像は、トレーニングデータが不足している場合にデータ拡張としても機能する。
顔の小さなデータセットを新しいポーズと表現で拡張することで、増強やデータの不足に応じて、認識性能を最大9%向上することを示す。
関連論文リスト
- Face Feature Visualisation of Single Morphing Attack Detection [13.680968065638108]
本稿では,異なる顔特徴抽出アルゴリズムの視覚化について説明する。
単変態攻撃検出のためのボナファイドの検出と変態画像を可能にする。
この視覚化は、境界ポリシーのためのグラフィカルユーザインタフェースの開発に役立つかもしれない。
論文 参考訳(メタデータ) (2023-04-25T17:51:23Z) - SARGAN: Spatial Attention-based Residuals for Facial Expression
Manipulation [1.7056768055368383]
本稿では,3つの視点から制限に対処するSARGANという新しい手法を提案する。
我々は対称エンコーダ・デコーダネットワークを利用して顔の特徴に複数スケールで対応した。
提案手法は最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-03-30T08:15:18Z) - Disentangling Identity and Pose for Facial Expression Recognition [54.50747989860957]
より識別的な特徴表現を学習するために,識別モデルを提案し,不整形表情認識(IPD-FER)モデルを提案する。
アイデンティティエンコーダでは、訓練中に訓練済みの顔認識モデルを利用して固定し、特定の表情訓練データに対する制限を軽減する。
合成された中性画像と同一個体の表情画像との差を比較することにより、表現成分はアイデンティティやポーズからさらに切り離される。
論文 参考訳(メタデータ) (2022-08-17T06:48:13Z) - Free-HeadGAN: Neural Talking Head Synthesis with Explicit Gaze Control [54.079327030892244]
Free-HeadGANは、人為的なニューラルトーキングヘッド合成システムである。
本研究では,3次元顔のランドマークが不足している顔のモデリングが,最先端の生成性能を達成するのに十分であることを示す。
論文 参考訳(メタデータ) (2022-08-03T16:46:08Z) - Learning to Aggregate and Personalize 3D Face from In-the-Wild Photo
Collection [65.92058628082322]
非パラメトリックフェースモデリングは形状仮定なしで画像からのみ3次元フェースを再構成することを目的としている。
本稿では,教師なしのロバストな3次元顔モデリングのための学習・アグリゲート・パーソナライズ・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T03:10:17Z) - A 3D GAN for Improved Large-pose Facial Recognition [3.791440300377753]
深層畳み込みニューラルネットワークを用いた顔認識は、顔画像の大きなデータセットの可用性に依存している。
近年の研究では、アイデンティティからポーズを離す方法が不十分であることが示されている。
本研究では,GAN発生器に3次元モーフィラブルモデルを組み込むことにより,野生画像から非線形テクスチャモデルを学習する。
これにより、新しい合成IDの生成と、アイデンティティを損なうことなくポーズ、照明、表現の操作が可能になります。
論文 参考訳(メタデータ) (2020-12-18T22:41:15Z) - InterFaceGAN: Interpreting the Disentangled Face Representation Learned
by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。
まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。
次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文 参考訳(メタデータ) (2020-05-18T18:01:22Z) - Pose Manipulation with Identity Preservation [0.0]
本稿では,文字適応性正規化GAN(CainGAN)を提案する。
CainGANは特定の個人から顔の数字を受け取り、その人物の身元を保存しながら新しい顔を生成する。
実験の結果, 生成画像の品質は, 推論時に使用する入力セットのサイズと一致していることがわかった。
論文 参考訳(メタデータ) (2020-04-20T09:51:31Z) - VAE/WGAN-Based Image Representation Learning For Pose-Preserving
Seamless Identity Replacement In Facial Images [15.855376604558977]
We present a novel variational generative adversarial network (VGAN) based on Wasserstein loss。
我々のネットワークは、ポーズ保存されたアイデンティティ・モーフィングとアイデンティティ保存されたポーズ・モーフィングの実行に利用できることを示す。
論文 参考訳(メタデータ) (2020-03-02T03:35:59Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z) - Fine-grained Image-to-Image Transformation towards Visual Recognition [102.51124181873101]
我々は,入力画像の同一性を保った画像を生成するために,微細なカテゴリで画像を変換することを目的としている。
我々は、画像のアイデンティティと非関連要因をアンハングルするために、生成的敵ネットワークに基づくモデルを採用する。
CompCarsとMulti-PIEデータセットの実験では、我々のモデルが生成した画像のアイデンティティを、最先端の画像-画像変換モデルよりもはるかによく保存していることが示された。
論文 参考訳(メタデータ) (2020-01-12T05:26:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。