論文の概要: GANalyzer: Analysis and Manipulation of GANs Latent Space for
Controllable Face Synthesis
- arxiv url: http://arxiv.org/abs/2302.00908v1
- Date: Thu, 2 Feb 2023 06:55:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-03 15:05:40.672657
- Title: GANalyzer: Analysis and Manipulation of GANs Latent Space for
Controllable Face Synthesis
- Title(参考訳): GANalyzer:制御可能な顔合成のためのGANの潜時空間の解析と操作
- Authors: Ali Pourramezan Fard, Mohammad H. Mahoor, Sarah Ariel Lamer, and
Timothy Sweeny
- Abstract要約: 本稿では, GANalyzer と呼ばれるフレームワークを提案する。
我々は,GANの潜伏空間における顔の絡みを解析し,不絡みのある顔の属性を編集するための変換法を提案する。
実験の結果,GANalyzerは顔の属性を編集し,どのような顔でも生成できることがわかった。
- 参考スコア(独自算出の注目度): 5.347801961181314
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Adversarial Networks (GANs) are capable of synthesizing
high-quality facial images. Despite their success, GANs do not provide any
information about the relationship between the input vectors and the generated
images. Currently, facial GANs are trained on imbalanced datasets, which
generate less diverse images. For example, more than 77% of 100K images that we
randomly synthesized using the StyleGAN3 are classified as Happy, and only
around 3% are Angry. The problem even becomes worse when a mixture of facial
attributes is desired: less than 1% of the generated samples are Angry Woman,
and only around 2% are Happy Black. To address these problems, this paper
proposes a framework, called GANalyzer, for the analysis, and manipulation of
the latent space of well-trained GANs. GANalyzer consists of a set of
transformation functions designed to manipulate latent vectors for a specific
facial attribute such as facial Expression, Age, Gender, and Race. We analyze
facial attribute entanglement in the latent space of GANs and apply the
proposed transformation for editing the disentangled facial attributes. Our
experimental results demonstrate the strength of GANalyzer in editing facial
attributes and generating any desired faces. We also create and release a
balanced photo-realistic human face dataset. Our code is publicly available on
GitHub.
- Abstract(参考訳): generative adversarial networks (gans) は高品質な顔画像を合成することができる。
彼らの成功にもかかわらず、GANは入力ベクトルと生成された画像の関係に関する情報を提供していない。
現在、顔のGANは不均衡なデータセットでトレーニングされており、より多様な画像を生成する。
例えば、StyleGAN3を用いてランダムに合成した100K画像の77%以上がHappyに分類され、Angryはわずか3%である。
顔の属性の混合が望まれると、問題はさらに悪化する。生成されたサンプルの1%未満はアングリーウーマンであり、約2%はハッピーブラックである。
これらの問題に対処するために, GANalyzer というフレームワークを提案し, 十分に訓練された GAN の潜伏空間の解析と操作を行う。
GANalyzerは、表情、年齢、ジェンダー、レースなどの特定の顔属性に対する潜伏ベクトルを操作するために設計された一連の変換関数で構成されている。
我々は,ganの潜在空間における顔属性の絡み合いを分析し,異種顔属性の編集に提案するトランスフォーメーションを適用した。
実験の結果,GANalyzerは顔の属性を編集し,どのような顔でも生成できることがわかった。
また、バランスの取れた写真リアルな人間の顔データセットを作成しリリースします。
私たちのコードはgithubで公開されている。
関連論文リスト
- G2Face: High-Fidelity Reversible Face Anonymization via Generative and Geometric Priors [71.69161292330504]
可逆顔匿名化(Reversible face anonymization)は、顔画像の繊細なアイデンティティ情報を、合成された代替品に置き換えようとしている。
本稿では,Gtextsuperscript2Faceを提案する。
提案手法は,高データの有効性を保ちながら,顔の匿名化と回復において既存の最先端技術よりも優れる。
論文 参考訳(メタデータ) (2024-08-18T12:36:47Z) - Towards Localized Fine-Grained Control for Facial Expression Generation [54.82883891478555]
人間、特にその顔は、豊かな表現と意図を伝える能力のために、コンテンツ生成の中心である。
現在の生成モデルは、主に平らな中立表現と文字なしの笑顔を認証なしで生成する。
顔生成における表情制御におけるAU(アクションユニット)の利用を提案する。
論文 参考訳(メタデータ) (2024-07-25T18:29:48Z) - FaceCom: Towards High-fidelity 3D Facial Shape Completion via Optimization and Inpainting Guidance [21.86674015428813]
FaceComはメッシュベースの生成ネットワークに基づく3次元顔形状補完手法である。
まず、2405のIDを含む混合3次元顔データセット上で形状生成装置を訓練する。
不完全な顔入力に基づいて、画像の塗装指導下での最適化手法を用いて、完全な顔に適合する。
論文 参考訳(メタデータ) (2024-06-04T07:54:10Z) - A Generalist FaceX via Learning Unified Facial Representation [77.74407008931486]
FaceXは、多様な顔タスクを同時に処理できる新しい顔ジェネラリストモデルである。
汎用的なFaceXは、一般的な顔編集タスクの精巧なタスク特化モデルと比較して、競争性能が向上する。
論文 参考訳(メタデータ) (2023-12-31T17:41:48Z) - DigiFace-1M: 1 Million Digital Face Images for Face Recognition [25.31469201712699]
最先端の顔認識モデルは、Wildデータセットのラベル付き顔に対して99.8%以上の精度で達成されている。
コンピュータグラフィックスパイプラインを用いてデジタル顔の描画によって得られた顔認識のための大規模合成データセットを提案する。
論文 参考訳(メタデータ) (2022-10-05T22:02:48Z) - FaceTuneGAN: Face Autoencoder for Convolutional Expression Transfer
Using Neural Generative Adversarial Networks [0.7043489166804575]
顔の識別と表情を分離して符号化する新しい3次元顔モデル表現であるFaceTuneGANを提案する。
本稿では,2次元領域で使用されている画像と画像の変換ネットワークを3次元顔形状に適応させる手法を提案する。
論文 参考訳(メタデータ) (2021-12-01T14:42:03Z) - Pro-UIGAN: Progressive Face Hallucination from Occluded Thumbnails [53.080403912727604]
Inpainting Generative Adversarial Network, Pro-UIGANを提案する。
顔の形状を利用して、隠された小さな顔の補充とアップサンプリング(8*)を行う。
Pro-UIGANは、HR面を視覚的に満足させ、下流タスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-08-02T02:29:24Z) - RoI Tanh-polar Transformer Network for Face Parsing in the Wild [50.8865921538953]
顔解析は、画像中のターゲット顔の顔成分のピクセルワイズラベルを予測することを目的としている。
既存のアプローチは通常、前処理中に計算されたバウンディングボックスに関して、入力画像からターゲット顔を取得する。
本稿では,画像全体を顔領域とコンテキストの固定比でTanh極表現に変換するRoI Tanh極変換を提案する。
第3に、Tanh極空間とTanh-Cartesian空間の両方に畳み込み層を含むハイブリッド残差表現学習ブロック、HybridBlockを提案する。
論文 参考訳(メタデータ) (2021-02-04T16:25:26Z) - InterFaceGAN: Interpreting the Disentangled Face Representation Learned
by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。
まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。
次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文 参考訳(メタデータ) (2020-05-18T18:01:22Z) - Imperfect ImaGANation: Implications of GANs Exacerbating Biases on
Facial Data Augmentation and Snapchat Selfie Lenses [20.36399588424965]
一般的なGAN(Generative Adversarial Networks)は,顔ショットのスキュー分布を与えられると,性別や肌の色調の軸に沿ってバイアスが増すことを示す。
GANはまた、非白人の肌の色を明るくし、工学教授の顔を生成する際に女性の顔の特徴を男性に変化させることによってバイアスを悪化させる。
論文 参考訳(メタデータ) (2020-01-26T21:57:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。