論文の概要: Attribute Controllable Beautiful Caucasian Face Generation by Aesthetics
Driven Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2208.04517v1
- Date: Tue, 9 Aug 2022 03:04:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-10 12:37:54.427962
- Title: Attribute Controllable Beautiful Caucasian Face Generation by Aesthetics
Driven Reinforcement Learning
- Title(参考訳): 審美的強化学習による属性制御可能な美しいコーカサス顔生成
- Authors: Xin Jin, Shu Zhao, Le Zhang, Xin Zhao, Qiang Deng, Chaoen Xiao
- Abstract要約: 我々はEigenGANのジェネレータに強化学習の技法を構築した。
エージェントは、生成した人間の顔のセマンティックな属性を、より好ましいものへ変更する方法を解明しようとする。
近年の強化学習コミュニティに出現する材料を取り入れた新しいバリエーションを提案する。
- 参考スコア(独自算出の注目度): 21.329906392100884
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, image generation has made great strides in improving the
quality of images, producing high-fidelity ones. Also, quite recently, there
are architecture designs, which enable GAN to unsupervisedly learn the semantic
attributes represented in different layers. However, there is still a lack of
research on generating face images more consistent with human aesthetics. Based
on EigenGAN [He et al., ICCV 2021], we build the techniques of reinforcement
learning into the generator of EigenGAN. The agent tries to figure out how to
alter the semantic attributes of the generated human faces towards more
preferable ones. To accomplish this, we trained an aesthetics scoring model
that can conduct facial beauty prediction. We also can utilize this scoring
model to analyze the correlation between face attributes and aesthetics scores.
Empirically, using off-the-shelf techniques from reinforcement learning would
not work well. So instead, we present a new variant incorporating the
ingredients emerging in the reinforcement learning communities in recent years.
Compared to the original generated images, the adjusted ones show clear
distinctions concerning various attributes. Experimental results using the
MindSpore, show the effectiveness of the proposed method. Altered facial images
are commonly more attractive, with significantly improved aesthetic levels.
- Abstract(参考訳): 近年、画像生成は画像の品質向上に大いに貢献し、忠実度の高い画像を生成するようになった。
また、最近になって、ganが異なる層で表される意味的属性を教師なしに学習できるアーキテクチャ設計が登場した。
しかし、人間の美学とより整合した顔画像の生成に関する研究はいまだに不足している。
EigenGAN [He et al., ICCV 2021]をベースとして、EigenGANのジェネレータへの強化学習技術を構築した。
エージェントは、生成した人間の顔のセマンティックな属性を、より好ましいものへ変更する方法を見つけようとする。
これを実現するために,顔面美容予測を行う美学スコアリングモデルをトレーニングした。
また、このスコアリングモデルを用いて、顔の属性と美学のスコアの相関を分析する。
実証的には、強化学習の既製技術はうまくいかなかった。
そこで本研究では,近年の強化学習コミュニティに出現する材料を取り入れた新しいバリエーションを提案する。
原画像と比較すると, 調整された画像は, 様々な属性について明瞭な特徴を示す。
MindSpore を用いた実験の結果,提案手法の有効性が示された。
修正された顔画像は一般的に魅力的で、審美レベルが大幅に改善されている。
関連論文リスト
- Towards the Detection of AI-Synthesized Human Face Images [12.090322373964124]
本稿では,GAN(Generative Adversarial Networks)とさまざまなDMによって生成される人間の顔画像を含むベンチマークを提案する。
そして、異なる生成モデルによって導入された偽の痕跡を周波数領域で解析し、様々な知見を得た。
さらに、周波数表現で訓練された検出器が、他の見えない生成モデルとよく一致できることを実証する。
論文 参考訳(メタデータ) (2024-02-13T19:37:44Z) - Detecting Generated Images by Real Images Only [64.12501227493765]
既存の画像検出手法は、生成画像中の視覚的アーティファクトを検出したり、大規模なトレーニングによって、実画像と生成画像の両方から識別的特徴を学習する。
本稿では,新たな視点から生成した画像検出問題にアプローチする。
実画像の共通性を見つけ、特徴空間内の密接な部分空間にマッピングすることで、生成した画像は生成モデルに関係なくサブ空間の外側に投影される。
論文 参考訳(メタデータ) (2023-11-02T03:09:37Z) - Neural Image-based Avatars: Generalizable Radiance Fields for Human
Avatar Modeling [28.242591786838936]
スパースな多視点画像から、任意の人間のパフォーマーの斬新なビューと新しいポーズを可能にする手法を提案する。
提案手法の重要な要素は,暗示体NeRF表現と画像ベースレンダリングの利点を組み合わせたハイブリッド外観ブレンディングモジュールである。
論文 参考訳(メタデータ) (2023-04-10T23:53:28Z) - Stare at What You See: Masked Image Modeling without Reconstruction [154.74533119863864]
Masked Autoencoders (MAE) は、大規模な視覚表現事前学習のパラダイムとして広く普及している。
近年の手法では, 画像特徴を再構成対象として抽出するために, セマンティック・リッチな教師モデルが適用されており, 性能が向上している。
強力な教師モデルによって抽出された特徴は、画像中の領域間のリッチなセマンティックな相関を既にエンコードしていると論じる。
論文 参考訳(メタデータ) (2022-11-16T12:48:52Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Detecting High-Quality GAN-Generated Face Images using Neural Networks [23.388645531702597]
本稿では,スペクトル帯域差を利用したGAN生成画像と実画像との区別手法を提案する。
特に,クロスバンド共起行列と空間共起行列を用いて,顔画像のデジタル保存を可能にする。
性能向上は特に重要であり、異なる後処理環境において92%以上を達成することを示す。
論文 参考訳(メタデータ) (2022-03-03T13:53:27Z) - Heredity-aware Child Face Image Generation with Latent Space
Disentanglement [96.92684978356425]
本研究では,子育てに先立つ親のイメージに基づいて子どものイメージを生成するための,子育てという新しいアプローチを提案する。
第一の考え方は、事前訓練された生成モデルの潜伏空間を乱し、明確な意味論で児童画像の顔属性を正確に制御することである。
論文 参考訳(メタデータ) (2021-08-25T06:59:43Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - Attributes Aware Face Generation with Generative Adversarial Networks [133.44359317633686]
AFGANと呼ばれる生成対向ネットワークを用いた新しい属性認識顔画像生成法を提案する。
3つの積み重ねたジェネレータは、それぞれ64ドル640ドル、128ドル128ドル、256ドル256ドルの解像度の顔画像を生成する。
さらに、生成した画像と入力属性の相関性を高めるために、画像-属性マッチング損失を提案する。
論文 参考訳(メタデータ) (2020-12-03T09:25:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。