論文の概要: A comprehensive survey on semantic facial attribute editing using
generative adversarial networks
- arxiv url: http://arxiv.org/abs/2205.10587v1
- Date: Sat, 21 May 2022 13:09:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-05 15:44:58.860234
- Title: A comprehensive survey on semantic facial attribute editing using
generative adversarial networks
- Title(参考訳): 生成型adversarial networkを用いた意味的顔属性編集に関する包括的調査
- Authors: Ahmad Nickabadi, Maryam Saeedi Fard, Nastaran Moradzadeh Farid, Najmeh
Mohammadbagheri
- Abstract要約: 多くの顔生成と操作モデルが提案されている。
セマンティック顔属性編集(Semantic face attribute editing)は、顔画像の1つ以上の属性の値を変更する過程である。
アーキテクチャに基づいて、最先端のモデルはエンコーダデコーダ、イメージ・ツー・イメージ、フォトガイドモデルに分類され、研究される。
- 参考スコア(独自算出の注目度): 0.688204255655161
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating random photo-realistic images has experienced tremendous growth
during the past few years due to the advances of the deep convolutional neural
networks and generative models. Among different domains, face photos have
received a great deal of attention and a large number of face generation and
manipulation models have been proposed. Semantic facial attribute editing is
the process of varying the values of one or more attributes of a face image
while the other attributes of the image are not affected. The requested
modifications are provided as an attribute vector or in the form of driving
face image and the whole process is performed by the corresponding models. In
this paper, we survey the recent works and advances in semantic facial
attribute editing. We cover all related aspects of these models including the
related definitions and concepts, architectures, loss functions, datasets,
evaluation metrics, and applications. Based on their architectures, the
state-of-the-art models are categorized and studied as encoder-decoder,
image-to-image, and photo-guided models. The challenges and restrictions of the
current state-of-the-art methods are discussed as well.
- Abstract(参考訳): ランダムなフォトリアリスティック画像の生成は、深層畳み込みニューラルネットワークと生成モデルの発展により、ここ数年で大きな成長を遂げている。
様々な領域において、顔写真は多くの注目を集めており、多数の顔生成と操作モデルが提案されている。
セマンティック顔属性編集(Semantic face attribute editing)は、顔画像の1つ以上の属性の値を変更するプロセスであり、画像の他の属性は影響を受けない。
要求された修正は属性ベクトルまたは駆動顔画像の形式で提供され、プロセス全体は対応するモデルによって実行される。
本稿では,意味的顔属性編集における最近の研究と進歩について述べる。
関連する定義や概念,アーキテクチャ,損失関数,データセット,評価指標,アプリケーションなど,これらのモデルに関するすべての側面をカバーしています。
アーキテクチャに基づいて、最先端のモデルはエンコーダデコーダ、イメージ・ツー・イメージ、フォトガイドモデルに分類され、研究される。
現在の最先端手法の課題と制約についても論じる。
関連論文リスト
- OSDFace: One-Step Diffusion Model for Face Restoration [72.5045389847792]
拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-26T07:07:48Z) - Mitigating the Impact of Attribute Editing on Face Recognition [14.138965856511387]
現代の生成型AIモデルを用いた顔属性の編集は、顔認識システムを著しく劣化させる可能性があることを示す。
局所的およびグローバルな属性編集のための2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-12T22:03:19Z) - Counterfactual Image Editing [54.21104691749547]
対物画像編集は、生成AIにおいて重要なタスクであり、ある機能が異なる場合、画像がどのように見えるかを尋ねる。
本稿では,形式言語を用いた対物画像編集タスクを形式化し,潜在生成因子と画像の因果関係をモデル化する。
ニューラル因果モデルを利用して、対物画像を生成する効率的なアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-02-07T20:55:39Z) - Limitations of Face Image Generation [12.11955119100926]
顔生成における生成モデルの有効性と欠点について検討した。
テキストプロンプトへの忠実度、人口格差、分布変化など、顔画像生成のいくつかの制限を識別する。
本稿では、学習データの選択が生成モデルの性能にどのように貢献するかを洞察する分析モデルを提案する。
論文 参考訳(メタデータ) (2023-09-13T19:33:26Z) - FaceChain: A Playground for Human-centric Artificial Intelligence
Generated Content [36.48960592782015]
FaceChainは、パーソナライズされたポートレート生成フレームワークで、一連のカスタマイズされた画像生成モデルと、顔に関連する知覚理解モデルの豊富なセットを組み合わせる。
我々は、複数のSOTAフェイスモデルを生成手順に注入し、従来のソリューションと比較して、より効率的なラベルタグ付け、データ処理、モデル後処理を実現する。
FaceChainをベースとして、仮想トライオンや2Dトーキングヘッドなど、その価値をよりよく示すための、より広いグラウンドを構築するためのいくつかのアプリケーションも開発しています。
論文 参考訳(メタデータ) (2023-08-28T02:20:44Z) - DreamIdentity: Improved Editability for Efficient Face-identity
Preserved Image Generation [69.16517915592063]
人間の顔の正確な表現を学習するための新しい顔識別エンコーダを提案する。
また、モデルの編集可能性を高めるために、自己拡張編集可能性学習を提案する。
我々の手法は、異なるシーン下でより高速にアイデンティティ保存された画像を生成することができる。
論文 参考訳(メタデータ) (2023-07-01T11:01:17Z) - Learning to Aggregate and Personalize 3D Face from In-the-Wild Photo
Collection [65.92058628082322]
非パラメトリックフェースモデリングは形状仮定なしで画像からのみ3次元フェースを再構成することを目的としている。
本稿では,教師なしのロバストな3次元顔モデリングのための学習・アグリゲート・パーソナライズ・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T03:10:17Z) - Face Age Progression With Attribute Manipulation [11.859913430860335]
FAWAM (Face Age Progression with Attribute Manipulation) を提唱する。
タスクをボトムアップ方式で,顔年齢の進行と顔属性の操作という2つのサブモジュールとして扱う。
顔の老化には、年齢に応じた顔の変化をモデル化できるピラミッド生成対向ネットワークを備えた属性意識型顔の老化モデルを用いる。
論文 参考訳(メタデータ) (2021-06-14T18:26:48Z) - Multimodal Face Synthesis from Visual Attributes [85.87796260802223]
本稿では,マルチモーダル顔画像を保存するIDを同時に合成する新たな生成対向ネットワークを提案する。
実画像と偽画像の区別を行う識別装置にマルチモーダルストレッチインモジュールを導入。
論文 参考訳(メタデータ) (2021-04-09T13:47:23Z) - High Resolution Face Editing with Masked GAN Latent Code Optimization [0.0]
顔の編集はコンピュータビジョンコミュニティで人気のある研究トピックである。
最近の提案手法は、条件付きエンコーダデコーダであるGAN(Generative Adversarial Network)をエンドツーエンドでトレーニングするか、事前に訓練されたバニラGANジェネレータモデルの潜時空間での動作を定義するかのいずれかである。
空間的および意味的制約を伴ったGAN組み込み最適化手順を提案する。
論文 参考訳(メタデータ) (2021-03-20T08:39:41Z) - Generating Person Images with Appearance-aware Pose Stylizer [66.44220388377596]
本稿では,人物のポーズや外見に基づいてリアルな人物画像を生成する,新しいエンドツーエンドフレームワークを提案する。
本フレームワークのコアとなるのは、ターゲットポーズと条件付き人物の外観を段階的に結合して人体画像を生成する、APS(Appearance-aware Pose Stylizer)と呼ばれる新しいジェネレータである。
論文 参考訳(メタデータ) (2020-07-17T15:58:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。