論文の概要: AgeFlow: Conditional Age Progression and Regression with Normalizing
Flows
- arxiv url: http://arxiv.org/abs/2105.07239v1
- Date: Sat, 15 May 2021 15:02:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 15:08:21.602034
- Title: AgeFlow: Conditional Age Progression and Regression with Normalizing
Flows
- Title(参考訳): AgeFlow: 正規化フローによる条件付き年齢の進行と回帰
- Authors: Zhizhong Huang, Shouzhen Chen, Junping Zhang, Hongming Shan
- Abstract要約: 年齢進行と回帰は, 顔画像の光リアリスティックな外観と老化効果, 再生効果をそれぞれ合成することを目的としている。
既存のgenerative adversarial networks (gans) ベースの手法は以下の3つの大きな問題に悩まされている。
本稿では、フローベースモデルとGANの両方の利点を統合するために、AgeFlowと呼ばれる新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 19.45760984401544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Age progression and regression aim to synthesize photorealistic appearance of
a given face image with aging and rejuvenation effects, respectively. Existing
generative adversarial networks (GANs) based methods suffer from the following
three major issues: 1) unstable training introducing strong ghost artifacts in
the generated faces, 2) unpaired training leading to unexpected changes in
facial attributes such as genders and races, and 3) non-bijective age mappings
increasing the uncertainty in the face transformation. To overcome these
issues, this paper proposes a novel framework, termed AgeFlow, to integrate the
advantages of both flow-based models and GANs. The proposed AgeFlow contains
three parts: an encoder that maps a given face to a latent space through an
invertible neural network, a novel invertible conditional translation module
(ICTM) that translates the source latent vector to target one, and a decoder
that reconstructs the generated face from the target latent vector using the
same encoder network; all parts are invertible achieving bijective age
mappings. The novelties of ICTM are two-fold. First, we propose an
attribute-aware knowledge distillation to learn the manipulation direction of
age progression while keeping other unrelated attributes unchanged, alleviating
unexpected changes in facial attributes. Second, we propose to use GANs in the
latent space to ensure the learned latent vector indistinguishable from the
real ones, which is much easier than traditional use of GANs in the image
domain. Experimental results demonstrate superior performance over existing
GANs-based methods on two benchmarked datasets. The source code is available at
https://github.com/Hzzone/AgeFlow.
- Abstract(参考訳): 年齢進行と回帰は, 顔画像の光リアリスティックな外観と老化効果, 再生効果をそれぞれ合成することを目的としている。
既存のgans(generative adversarial network)ベースの手法は,1)生成した顔に強いゴーストアーティファクトを導入する不安定なトレーニング,2)性別や人種などの予期せぬ顔属性の変化につながる非ペアトレーニング,3)顔変換の不確実性を高める非単射年齢マッピング,の3つの大きな問題に苦しむ。
これらの問題を克服するために,フローベースモデルとGANの両方の利点を統合する新しいフレームワークである AgeFlow を提案する。
提案したAgeFlowは、3つの部分から構成される: 与えられた顔を非可逆ニューラルネットワークを介して潜伏空間にマッピングするエンコーダ、ソース潜伏ベクトルを目標に翻訳する新しい非可逆条件翻訳モジュール(ICTM)、同じエンコーダネットワークを用いてターゲット潜伏ベクトルから生成された顔を再構成するデコーダ。
ICTMの新規性は2倍である。
まず, 顔属性の予期せぬ変化を軽減しつつ, 年齢変化の操作方向を学習するための属性認識型知識蒸留法を提案する。
第二に、画像領域における従来のganの使用よりもはるかに簡単で、学習された潜在ベクトルが実ベクトルと区別できないことを保証するために、潜在空間でのganの使用を提案する。
実験により、2つのベンチマークデータセット上での既存のGAN法よりも優れた性能を示した。
ソースコードはhttps://github.com/hzzone/ageflowで入手できる。
関連論文リスト
- G2Face: High-Fidelity Reversible Face Anonymization via Generative and Geometric Priors [71.69161292330504]
可逆顔匿名化(Reversible face anonymization)は、顔画像の繊細なアイデンティティ情報を、合成された代替品に置き換えようとしている。
本稿では,Gtextsuperscript2Faceを提案する。
提案手法は,高データの有効性を保ちながら,顔の匿名化と回復において既存の最先端技術よりも優れる。
論文 参考訳(メタデータ) (2024-08-18T12:36:47Z) - Tilt your Head: Activating the Hidden Spatial-Invariance of Classifiers [0.7704032792820767]
ディープニューラルネットワークは、日々の生活の多くの領域に適用されている。
これらは、空間的に変換された入力信号に頑健に対処するなど、依然として必須の能力が欠如している。
本稿では,ニューラルネットの推論過程をエミュレートする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-06T09:47:29Z) - CLR-Face: Conditional Latent Refinement for Blind Face Restoration Using
Score-Based Diffusion Models [57.9771859175664]
最近の生成優先法は、有望なブラインドフェイス修復性能を示している。
入力に忠実なきめ細かい顔の詳細を生成することは、依然として難しい問題である。
本稿では,VQGANアーキテクチャの内部に拡散型プライマーを導入し,非破壊な潜伏埋め込みにおける分布の学習に重点を置いている。
論文 参考訳(メタデータ) (2024-02-08T23:51:49Z) - SARGAN: Spatial Attention-based Residuals for Facial Expression
Manipulation [1.7056768055368383]
本稿では,3つの視点から制限に対処するSARGANという新しい手法を提案する。
我々は対称エンコーダ・デコーダネットワークを利用して顔の特徴に複数スケールで対応した。
提案手法は最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-03-30T08:15:18Z) - FaceTuneGAN: Face Autoencoder for Convolutional Expression Transfer
Using Neural Generative Adversarial Networks [0.7043489166804575]
顔の識別と表情を分離して符号化する新しい3次元顔モデル表現であるFaceTuneGANを提案する。
本稿では,2次元領域で使用されている画像と画像の変換ネットワークを3次元顔形状に適応させる手法を提案する。
論文 参考訳(メタデータ) (2021-12-01T14:42:03Z) - Disentangled Lifespan Face Synthesis [100.29058545878341]
ライフスパン顔合成(LFS)モデルは、1つのスナップショットのみを基準として、人の人生全体の写真リアル顔画像のセットを作成することを目的としている。
対象年齢コードから生成された顔画像は, 形状やテクスチャの生鮮やかな変換によって, 年齢に敏感に反映されることが期待される。
これは、エンコーダから形状、テクスチャ、アイデンティティの特徴を別々に抽出することで達成される。
論文 参考訳(メタデータ) (2021-08-05T22:33:14Z) - Mitigating Generation Shifts for Generalized Zero-Shot Learning [52.98182124310114]
一般化ゼロショット学習(英: Generalized Zero-Shot Learning、GZSL)は、学習中に見知らぬクラスが観察できない、見つからないサンプルを認識するために意味情報(属性など)を活用するタスクである。
本稿では,未知のデータ合成を効率よく,効率的に学習するための新しい生成シフト緩和フローフレームワークを提案する。
実験結果から,GSMFlowは従来のゼロショット設定と一般化されたゼロショット設定の両方において,最先端の認識性能を実現することが示された。
論文 参考訳(メタデータ) (2021-07-07T11:43:59Z) - Do Generative Models Know Disentanglement? Contrastive Learning is All
You Need [59.033559925639075]
本論文では,変数空間におけるコントラスト(DisCo)による非監視的,モデル非依存的手法を提案する。
DisCoは、GAN、VAE、およびフローを含む、事前訓練された非解離生成モデルに与えられた最先端の解離を達成します。
論文 参考訳(メタデータ) (2021-02-21T08:01:20Z) - PFA-GAN: Progressive Face Aging with Generative Adversarial Network [19.45760984401544]
本論文では,PFA-GANを基盤とした新しい顔老化フレームワークを提案する。
このフレームワークは、蓄積されたアーティファクトと曖昧さを取り除くために、エンドツーエンドでトレーニングすることができる。
実験により,既存の (c) GANs 法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-12-07T05:45:13Z) - Robust Person Re-Identification through Contextual Mutual Boosting [77.1976737965566]
本研究では,歩行者の局地化を目的としたコンテキスト相互ブースティングネットワーク(CMBN)を提案する。
歩行者をローカライズし、文脈情報と統計的推測を効果的に活用することで特徴を再検討する。
ベンチマークの実験は、最先端のアーキテクチャと比較してアーキテクチャの優位性を示している。
論文 参考訳(メタデータ) (2020-09-16T06:33:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。