論文の概要: Identity-preserving Editing of Multiple Facial Attributes by Learning
Global Edit Directions and Local Adjustments
- arxiv url: http://arxiv.org/abs/2309.14267v1
- Date: Mon, 25 Sep 2023 16:28:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 14:39:34.116426
- Title: Identity-preserving Editing of Multiple Facial Attributes by Learning
Global Edit Directions and Local Adjustments
- Title(参考訳): グローバル編集指示と局所調整学習による複数顔属性の識別保存編集
- Authors: Najmeh Mohammadbagheri, Fardin Ayar, Ahmad Nickabadi, Reza Safabakhsh
- Abstract要約: ID-Styleは属性操作時のID損失に対処できる新しいアーキテクチャである。
本稿では、IAIPとともに入力インスタンスの同一性を保持する半スパースな意味方向を見つけるために、LGDを強制する訓練中に2つの損失を導入する。
- 参考スコア(独自算出の注目度): 4.082799056366928
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic facial attribute editing using pre-trained Generative Adversarial
Networks (GANs) has attracted a great deal of attention and effort from
researchers in recent years. Due to the high quality of face images generated
by StyleGANs, much work has focused on the StyleGANs' latent space and the
proposed methods for facial image editing. Although these methods have achieved
satisfying results for manipulating user-intended attributes, they have not
fulfilled the goal of preserving the identity, which is an important challenge.
We present ID-Style, a new architecture capable of addressing the problem of
identity loss during attribute manipulation. The key components of ID-Style
include Learnable Global Direction (LGD), which finds a shared and semi-sparse
direction for each attribute, and an Instance-Aware Intensity Predictor (IAIP)
network, which finetunes the global direction according to the input instance.
Furthermore, we introduce two losses during training to enforce the LGD to find
semi-sparse semantic directions, which along with the IAIP, preserve the
identity of the input instance. Despite reducing the size of the network by
roughly 95% as compared to similar state-of-the-art works, it outperforms
baselines by 10% and 7% in Identity preserving metric (FRS) and average
accuracy of manipulation (mACC), respectively.
- Abstract(参考訳): 事前訓練されたgans(generative adversarial network)を用いた意味的顔属性編集は、近年研究者から多くの注目を集めている。
StyleGANsが生成する顔画像の品質の高さのため、StyleGANsの潜伏空間と顔画像編集のための提案手法に多くの研究が注がれている。
これらの手法は, ユーザ意図属性を操作するための満足度の高い結果を得たが, アイデンティティの保存という目標を達成できていないため, 重要な課題である。
本稿では属性操作時のID損失に対処できる新しいアーキテクチャID-Styleを提案する。
ID-Styleのキーコンポーネントには、各属性の共有および半スパース方向を検出するLearnable Global Direction(LGD)と、入力インスタンスに応じてグローバル方向を微調整するインスタンス・アウェア・インテンシティ予測器(IAIP)ネットワークがある。
さらに、IAIPとともに入力インスタンスの同一性を保持する半スパースな意味方向を見つけるために、LGDを強制する訓練中に2つの損失を導入する。
類似の最先端技術と比較してネットワークのサイズを約95%削減したにもかかわらず、ベースラインを10%上回り、Identity Preserving metric (FRS) と平均操作精度 (mACC) で7%上回っている。
関連論文リスト
- Latent Diffusion Models for Attribute-Preserving Image Anonymization [4.080920304681247]
本稿では,遅延拡散モデル(LDM)に基づく画像匿名化への最初のアプローチを提案する。
CAFLaGE-Baseは、事前訓練された制御ネットと、実画像と匿名画像との距離を増やすために設計された新しい制御機構を組み合わせた2つのLCMを提案する。
論文 参考訳(メタデータ) (2024-03-21T19:09:21Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - StyleID: Identity Disentanglement for Anonymizing Faces [4.048444203617942]
この論文の主な貢献は、フィーチャ保存の匿名化フレームワークであるStyleIDの設計である。
コントリビューションの一環として,新しいアンタングル化指標,補足的アンタングル化法,およびアイデンティティ・アンタングル化に関する新たな知見を提示する。
StyleIDはチューナブルなプライバシを提供し、計算の複雑さが低く、現在の最先端ソリューションを上回っている。
論文 参考訳(メタデータ) (2022-12-28T12:04:24Z) - TransFA: Transformer-based Representation for Face Attribute Evaluation [87.09529826340304]
我々はtextbfTransFA を用いたtextbfattribute 評価のための新しい textbf Transformer 表現を提案する。
提案するTransFAは,最先端手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-12T10:58:06Z) - A Unified Architecture of Semantic Segmentation and Hierarchical
Generative Adversarial Networks for Expression Manipulation [52.911307452212256]
セマンティックセグメンテーションと階層的GANの統一アーキテクチャを開発する。
我々のフレームワークのユニークな利点は、将来的なセマンティックセグメンテーションネットワーク条件を生成モデルに渡すことである。
我々は,AffectNetとRaFDの2つの難解な表情翻訳ベンチマークとセマンティックセグメンテーションベンチマークであるCelebAMask-HQについて評価を行った。
論文 参考訳(メタデータ) (2021-12-08T22:06:31Z) - FacialGAN: Style Transfer and Attribute Manipulation on Synthetic Faces [9.664892091493586]
FacialGANは、リッチなスタイル転送と対話的な顔属性操作を可能にする新しいフレームワークである。
モデルが視覚的に説得力のある結果を生み出す能力は,スタイル伝達,属性操作,多様性,顔認証などである。
論文 参考訳(メタデータ) (2021-10-18T15:53:38Z) - FaceController: Controllable Attribute Editing for Face in the Wild [74.56117807309576]
単純なフィードフォワードネットワークを提案し、高忠実度な顔を生成する。
本手法では,既存かつ容易に把握可能な事前情報を利用することで,野生の多様な顔属性の制御,転送,編集を行うことができる。
本手法では,3Dプリミティブを用いてアイデンティティ,表現,ポーズ,イルミネーションを分離し,地域別スタイルコードを用いてテクスチャとカラーを分離する。
論文 参考訳(メタデータ) (2021-02-23T02:47:28Z) - CAFE-GAN: Arbitrary Face Attribute Editing with Complementary Attention
Feature [31.425326840578098]
本稿では,対象属性に関連する顔の部分のみを編集する新しいGANモデルを提案する。
CAFEは、目的属性と相補属性の両方を考慮し、変換すべき顔領域を特定する。
論文 参考訳(メタデータ) (2020-11-24T05:21:03Z) - PA-GAN: Progressive Attention Generative Adversarial Network for Facial
Attribute Editing [67.94255549416548]
顔属性編集のためのプログレッシブアテンションGAN(PA-GAN)を提案する。
提案手法は,非関連情報による属性の正確な編集を,最先端技術と比較してはるかによく保存する。
論文 参考訳(メタデータ) (2020-07-12T03:04:12Z) - Deep Multi-task Multi-label CNN for Effective Facial Attribute
Classification [53.58763562421771]
DMM-CNN(ディープ・マルチタスク・マルチラベル・CNN)による効果的な顔属性分類(FAC)を提案する。
具体的には、DMM-CNNは、2つの密接に関連するタスク(顔のランドマーク検出とFAC)を共同で最適化し、マルチタスク学習を活用することにより、FACの性能を向上させる。
2つの異なるネットワークアーキテクチャは2つの属性のグループの特徴を抽出するために設計され、トレーニング中に各顔属性に損失重みを自動的に割り当てる新しい動的重み付け方式が提案されている。
論文 参考訳(メタデータ) (2020-02-10T12:34:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。