論文の概要: Only a Matter of Style: Age Transformation Using a Style-Based
Regression Model
- arxiv url: http://arxiv.org/abs/2102.02754v1
- Date: Thu, 4 Feb 2021 17:33:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-05 22:51:03.951693
- Title: Only a Matter of Style: Age Transformation Using a Style-Based
Regression Model
- Title(参考訳): スタイルのみの問題:スタイルに基づく回帰モデルを用いた年齢変換
- Authors: Yuval Alaluf, Or Patashnik, Daniel Cohen-Or
- Abstract要約: 本稿では,事前学習した未条件GANの潜在空間に実際の顔画像をエンコードする画像から画像への変換手法を提案する。
所望の年齢に対応する潜時符号を生成する際に,エンコーダを明示的に案内するために,事前学習した年齢回帰ネットワークを用いる。
- 参考スコア(独自算出の注目度): 46.48263482909809
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The task of age transformation illustrates the change of an individual's
appearance over time. Accurately modeling this complex transformation over an
input facial image is extremely challenging as it requires making convincing
and possibly large changes to facial features and head shape, while still
preserving the input identity. In this work, we present an image-to-image
translation method that learns to directly encode real facial images into the
latent space of a pre-trained unconditional GAN (e.g., StyleGAN) subject to a
given aging shift. We employ a pre-trained age regression network used to
explicitly guide the encoder in generating the latent codes corresponding to
the desired age. In this formulation, our method approaches the continuous
aging process as a regression task between the input age and desired target
age, providing fine-grained control over the generated image. Moreover, unlike
other approaches that operate solely in the latent space using a prior on the
path controlling age, our method learns a more disentangled, non-linear path.
Finally, we demonstrate that the end-to-end nature of our approach, coupled
with the rich semantic latent space of StyleGAN, allows for further editing of
the generated images. Qualitative and quantitative evaluations show the
advantages of our method compared to state-of-the-art approaches.
- Abstract(参考訳): 年齢変化のタスクは、時間とともに個人の外観が変化することを示している。
入力された顔画像に対して、この複雑な変換を正確にモデル化することは、入力アイデンティティを保ちながら、顔の特徴や頭部の形状に大きな変更を加える必要があるため、非常に難しい。
本研究では,事前学習した未条件GAN(例えば,StyleGAN)の潜時空間に直接実際の顔画像をエンコードすることを学習する画像から画像への変換手法を提案する。
所望の年齢に対応する潜時符号を生成する際に,エンコーダを明示的に案内するために,事前学習した年齢回帰ネットワークを用いる。
本提案手法は,入力年齢と目標年齢の間の回帰タスクとして連続老化プロセスにアプローチし,生成画像の細粒度制御を行う。
さらに、経路制御年齢に先行して潜伏空間でのみ動作する他の手法とは異なり、本手法はより不整合で非線形な経路を学習する。
最後に、私たちのアプローチのエンドツーエンドの性質とStyleGANのリッチなセマンティックな潜在空間が、生成された画像をさらに編集できることを実証します。
質的・定量的評価は,最先端の手法と比較して,本手法の利点を示す。
関連論文リスト
- IdenBAT: Disentangled Representation Learning for Identity-Preserved Brain Age Transformation [9.23090816270662]
脳年齢変換は、対象年齢群の年齢固有の特徴を正確に反映した、参照脳画像を合成画像に変換することを目的としている。
IdenBATと呼ばれるアイデンティティ保存型脳年齢変換に不整合表現学習を用いた新しいアーキテクチャを提案する。
本手法は,個々の特徴を正確に保持しながら,入力画像を目標年齢に適応的に変換する。
論文 参考訳(メタデータ) (2024-10-22T12:20:15Z) - ToonAging: Face Re-Aging upon Artistic Portrait Style Transfer [6.305926064192544]
ポートレート・スタイル・トランスファーと組み合わさって, 顔のリエイジングのための新しいワンステージ手法を提案する。
同じPRドメイン内でトレーニングされた既存の顔のリエイジとスタイル転送ネットワークを活用します。
提案手法は,ドメインレベルの微調整手法に比べて柔軟性が高い。
論文 参考訳(メタデータ) (2024-02-05T05:25:33Z) - Face Aging via Diffusion-based Editing [5.318584973533008]
FAdingは,Diffusion-based editiNGによる顔の老化に対処するための新しいアプローチである。
我々は、大規模言語画像拡散モデルのリッチな事前利用により、既存の手法を超越する。
提案手法は, 経年的精度, 属性保存, 経年的品質に関して, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-20T13:47:10Z) - FP-Age: Leveraging Face Parsing Attention for Facial Age Estimation in
the Wild [50.8865921538953]
年齢推定に顔のセマンティクスを明示的に組み込む手法を提案する。
我々は,顔解析に基づくネットワークを設計し,異なるスケールで意味情報を学習する。
提案手法は,既存の年齢推定手法を常に上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-21T14:31:32Z) - Pose Guided Person Image Generation with Hidden p-Norm Regression [113.41144529452663]
ポーズ誘導者画像生成タスクを解くための新しいアプローチを提案する。
提案手法では,各アイデンティティに対するポーズ不変特徴行列を推定し,対象ポーズに条件づけられたターゲットの出現を予測できる。
提案手法は, 上記すべての変種シナリオにおいて, 競合性能を示す。
論文 参考訳(メタデータ) (2021-02-19T17:03:54Z) - Age Gap Reducer-GAN for Recognizing Age-Separated Faces [72.26969872180841]
本稿では,年齢変化に伴う顔と時間変化をマッチングする新しいアルゴリズムを提案する。
提案手法は,顔の年齢推定と年齢別顔の検証を組み合わせた統合フレームワークである。
論文 参考訳(メタデータ) (2020-11-11T16:43:32Z) - Transforming Facial Weight of Real Images by Editing Latent Space of
StyleGAN [9.097538101642192]
本稿では,GAN(Generative Adversarial Networks)の潜伏空間に符号化された意味的顔属性を活用することにより,入力顔画像の顔重量をより薄くあるいは重くするために変換する逆・エディットフレームワークを提案する。
我々のフレームワークは、大量のラベル付き顔画像をスクラッチからトレーニングすることなく、高品質でリアルな顔重み変換を実現することを実証的に示している。
われわれの枠組みは、身近な行動が外見に与える影響を可視化することによって、個人に健康的な食品選択を動機付けるための介入として活用することができる。
論文 参考訳(メタデータ) (2020-11-05T01:45:18Z) - Semantic Photo Manipulation with a Generative Image Prior [86.01714863596347]
GANは、ユーザスケッチ、テキスト、セマンティックラベルなどの入力に条件付きイメージを合成することができる。
GANが入力画像を正確に再現することは困難である。
本稿では,GANが以前に学んだイメージを個々の画像の統計に適応させることにより,これらの問題に対処する。
提案手法は,入力画像の外観と一致して,入力画像を正確に再構成し,新たなコンテンツを合成することができる。
論文 参考訳(メタデータ) (2020-05-15T18:22:05Z) - Lifespan Age Transformation Synthesis [40.963816368819415]
本稿では,新しい画像から画像へ生成する対向的ネットワークアーキテクチャを提案する。
我々のフレームワークは、1枚の写真から0歳から70歳までの完全な頭部像を予測できる。
論文 参考訳(メタデータ) (2020-03-21T22:48:06Z) - Fine-grained Image-to-Image Transformation towards Visual Recognition [102.51124181873101]
我々は,入力画像の同一性を保った画像を生成するために,微細なカテゴリで画像を変換することを目的としている。
我々は、画像のアイデンティティと非関連要因をアンハングルするために、生成的敵ネットワークに基づくモデルを採用する。
CompCarsとMulti-PIEデータセットの実験では、我々のモデルが生成した画像のアイデンティティを、最先端の画像-画像変換モデルよりもはるかによく保存していることが示された。
論文 参考訳(メタデータ) (2020-01-12T05:26:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。