論文の概要: Heredity-aware Child Face Image Generation with Latent Space
Disentanglement
- arxiv url: http://arxiv.org/abs/2108.11080v1
- Date: Wed, 25 Aug 2021 06:59:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-26 13:00:54.279906
- Title: Heredity-aware Child Face Image Generation with Latent Space
Disentanglement
- Title(参考訳): 遺伝性認知型小児顔画像生成における空間歪みの遅延
- Authors: Xiao Cui, Wengang Zhou, Yang Hu, Weilun Wang and Houqiang Li
- Abstract要約: 本研究では,子育てに先立つ親のイメージに基づいて子どものイメージを生成するための,子育てという新しいアプローチを提案する。
第一の考え方は、事前訓練された生成モデルの潜伏空間を乱し、明確な意味論で児童画像の顔属性を正確に制御することである。
- 参考スコア(独自算出の注目度): 96.92684978356425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative adversarial networks have been widely used in image synthesis in
recent years and the quality of the generated image has been greatly improved.
However, the flexibility to control and decouple facial attributes (e.g., eyes,
nose, mouth) is still limited. In this paper, we propose a novel approach,
called ChildGAN, to generate a child's image according to the images of parents
with heredity prior. The main idea is to disentangle the latent space of a
pre-trained generation model and precisely control the face attributes of child
images with clear semantics. We use distances between face landmarks as pseudo
labels to figure out the most influential semantic vectors of the corresponding
face attributes by calculating the gradient of latent vectors to pseudo labels.
Furthermore, we disentangle the semantic vectors by weighting irrelevant
features and orthogonalizing them with Schmidt Orthogonalization. Finally, we
fuse the latent vector of the parents by leveraging the disentangled semantic
vectors under the guidance of biological genetic laws. Extensive experiments
demonstrate that our approach outperforms the existing methods with encouraging
results.
- Abstract(参考訳): 近年, 画像合成において生成的敵対ネットワークが広く利用されており, 生成画像の品質が大幅に向上している。
しかし、顔の特徴(例えば、目、鼻、口)を制御・分離する柔軟性はまだ限られている。
そこで,本研究では,先天的な遺伝を持つ親のイメージに基づいて,子どものイメージを生成するための新しいアプローチであるchildganを提案する。
主なアイデアは、事前訓練された世代モデルの潜在空間を分離し、明確な意味を持つ児童画像の顔属性を正確に制御することである。
我々は、顔ランドマーク間の距離を擬似ラベルとして使用し、潜在ベクトルの擬似ラベルへの勾配を計算し、対応する顔属性の最も影響力のある意味ベクトルを求める。
さらに、無関係な特徴を重み付け、シュミット直交化で直交化することにより意味ベクトルをアンタングル化する。
最後に, 生物学的遺伝法則の指導のもと, 両親の潜伏ベクトルを, 絡み合った意味ベクトルを利用して融合する。
大規模な実験により,本手法は既存の手法よりも優れた性能を示した。
関連論文リスト
- Semantic Contextualization of Face Forgery: A New Definition, Dataset, and Detection Method [77.65459419417533]
我々は,顔フォージェリを意味的文脈に配置し,意味的顔属性を変更する計算手法が顔フォージェリの源であることを定義した。
階層的なグラフで整理されたラベルの集合に各画像が関連付けられている大規模な顔偽画像データセットを構築した。
本稿では,ラベル関係を捕捉し,その優先課題を優先するセマンティクス指向の顔偽造検出手法を提案する。
論文 参考訳(メタデータ) (2024-05-14T10:24:19Z) - Attribute Controllable Beautiful Caucasian Face Generation by Aesthetics
Driven Reinforcement Learning [21.329906392100884]
我々はEigenGANのジェネレータに強化学習の技法を構築した。
エージェントは、生成した人間の顔のセマンティックな属性を、より好ましいものへ変更する方法を解明しようとする。
近年の強化学習コミュニティに出現する材料を取り入れた新しいバリエーションを提案する。
論文 参考訳(メタデータ) (2022-08-09T03:04:10Z) - Semantic Unfolding of StyleGAN Latent Space [0.7646713951724012]
GAN(Generative Adversarial Network)は、入力された実画像に対応する潜伏符号を反転操作することによって、画像編集において驚くほど効率的であることが証明されている。
この編集性は、潜在空間の非絡み合いの性質から生じる。
本稿では, 顔属性のアンタングル化が最適ではないことを確認し, 線形属性分離に依存する顔の編集に欠陥があることを示す。
論文 参考訳(メタデータ) (2022-06-29T20:22:10Z) - Spatially Multi-conditional Image Generation [80.04130168156792]
本稿では,マルチ条件画像生成の問題に対処する新しいニューラルアーキテクチャを提案する。
提案手法は, 利用可能なラベルを入力トークンとして受信する, 画素単位のトランスフォーマー型アーキテクチャを用いる。
3つのベンチマークデータセットに対する実験により,提案手法の最先端および比較ベースラインに対する明らかな優位性を示した。
論文 参考訳(メタデータ) (2022-03-25T17:57:13Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Unsupervised Discovery of Disentangled Manifolds in GANs [74.24771216154105]
解釈可能な生成プロセスは、様々な画像編集アプリケーションに有用である。
本稿では,任意の学習された生成逆数ネットワークが与えられた潜在空間における解釈可能な方向を検出する枠組みを提案する。
論文 参考訳(メタデータ) (2020-11-24T02:18:08Z) - InterFaceGAN: Interpreting the Disentangled Face Representation Learned
by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。
まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。
次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文 参考訳(メタデータ) (2020-05-18T18:01:22Z) - Disentangled and Controllable Face Image Generation via 3D
Imitative-Contrastive Learning [43.53235319568048]
本研究では,不整合かつ正確に制御可能な潜伏表現を持つ仮想人物の顔画像生成手法であるDiscoFaceGANを提案する。
解析的3次元顔の変形・描画過程のイメージ形成を模倣するために,3次元前処理を逆学習に組み込んでネットワークを訓練する。
論文 参考訳(メタデータ) (2020-04-24T11:21:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。