論文の概要: Pluralistic Aging Diffusion Autoencoder
- arxiv url: http://arxiv.org/abs/2303.11086v2
- Date: Thu, 24 Aug 2023 03:53:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-25 18:10:02.214969
- Title: Pluralistic Aging Diffusion Autoencoder
- Title(参考訳): 複数の時効拡散オートエンコーダ
- Authors: Peipei Li, Rui Wang, Huaibo Huang, Ran He, Zhaofeng He
- Abstract要約: 顔の老化は、複数のプラプシブルな老化パターンが与えられた入力に対応する可能性があるため、不適切な問題である。
本稿では,CLIP駆動型多言語時効拡散オートエンコーダを提案する。
- 参考スコア(独自算出の注目度): 63.50599304294062
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face aging is an ill-posed problem because multiple plausible aging patterns
may correspond to a given input. Most existing methods often produce one
deterministic estimation. This paper proposes a novel CLIP-driven Pluralistic
Aging Diffusion Autoencoder (PADA) to enhance the diversity of aging patterns.
First, we employ diffusion models to generate diverse low-level aging details
via a sequential denoising reverse process. Second, we present Probabilistic
Aging Embedding (PAE) to capture diverse high-level aging patterns, which
represents age information as probabilistic distributions in the common CLIP
latent space. A text-guided KL-divergence loss is designed to guide this
learning. Our method can achieve pluralistic face aging conditioned on
open-world aging texts and arbitrary unseen face images. Qualitative and
quantitative experiments demonstrate that our method can generate more diverse
and high-quality plausible aging results.
- Abstract(参考訳): 複数のプラプティブルな老化パターンが与えられた入力に対応する可能性があるため、顔の老化は不適切な問題である。
ほとんどの既存手法は、しばしば一つの決定論的推定を生成する。
本稿では,老化パターンの多様性を高めるために,クリップ駆動型多元的老化拡散オートエンコーダ (pada) を提案する。
まず, 拡散モデルを用いて, 逐次デノージング逆プロセスを通じて, 様々な低レベルな老化詳細を生成する。
第2に, 年齢情報を共通CLIP潜伏空間の確率分布として表現する多種多様な高次老化パターンを捉えるための確率的老化埋め込み(PAE)を提案する。
テキスト誘導KL分割損失は、この学習を導くために設計されている。
本手法は,オープンワールドの高齢化テキストと任意の未知の顔画像に基づいて,多元的顔老化を実現する。
質的,定量的な実験により,より多様で高品質な老化結果が得られた。
関連論文リスト
- Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis [70.58988592832684]
PGPIS(Pose-Guided Person Image Synthesis)のためのCFLD(Coarse-to-Fine Latent Diffusion)法を提案する。
認識修正デコーダは、学習可能なクエリの集合を段階的に洗練し、粗いプロンプトとして人物画像の意味的理解を抽出するように設計されている。
論文 参考訳(メタデータ) (2024-02-28T06:07:07Z) - CLR-Face: Conditional Latent Refinement for Blind Face Restoration Using
Score-Based Diffusion Models [57.9771859175664]
最近の生成優先法は、有望なブラインドフェイス修復性能を示している。
入力に忠実なきめ細かい顔の詳細を生成することは、依然として難しい問題である。
本稿では,VQGANアーキテクチャの内部に拡散型プライマーを導入し,非破壊な潜伏埋め込みにおける分布の学習に重点を置いている。
論文 参考訳(メタデータ) (2024-02-08T23:51:49Z) - Diverse and Lifespan Facial Age Transformation Synthesis with Identity
Variation Rationality Metric [14.139807463289042]
本稿では,人間の顔上でのディバース・ライフスパン・エイジ・トランスフォーメーションを実現するアルゴリズムであるDLAT+を紹介する。
モデルに埋め込まれた多様性のメカニズムとは別に、複数の一貫性の制限が活用され、反ファクト的な老化合成を防ぐことができる。
論文 参考訳(メタデータ) (2024-01-25T09:26:08Z) - Face Aging via Diffusion-based Editing [5.318584973533008]
FAdingは,Diffusion-based editiNGによる顔の老化に対処するための新しいアプローチである。
我々は、大規模言語画像拡散モデルのリッチな事前利用により、既存の手法を超越する。
提案手法は, 経年的精度, 属性保存, 経年的品質に関して, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-20T13:47:10Z) - Evade the Trap of Mediocrity: Promoting Diversity and Novelty in Text
Generation via Concentrating Attention [85.5379146125199]
強力なトランスフォーマーアーキテクチャは高品質な文を生成するのに優れていることが証明されている。
本研究では,Transformerにおけるスペーサーの注意値が多様性を向上させることを発見した。
注意分布のシャープさを制御するために,新しい注意正規化損失を導入する。
論文 参考訳(メタデータ) (2022-11-14T07:53:16Z) - When Age-Invariant Face Recognition Meets Face Age Synthesis: A
Multi-Task Learning Framework and A New Benchmark [45.31997043789471]
MTLFaceは、モデル解釈のための表情合成を行いながら、年齢不変の識別関連表現を顔認識のために学習することができる。
我々は、年齢と性別のアノテーションを備えた大規模な顔データセットと、長寿児の追跡に特化して設計された新しいベンチマークをリリースする。
論文 参考訳(メタデータ) (2022-10-17T07:04:19Z) - Dual Spoof Disentanglement Generation for Face Anti-spoofing with Depth
Uncertainty Learning [54.15303628138665]
フェース・アンチ・スプーフィング(FAS)は、顔認識システムが提示攻撃を防ぐ上で重要な役割を担っている。
既存のフェース・アンチ・スプーフィング・データセットは、アイデンティティと重要なばらつきが不十分なため、多様性を欠いている。
我々は「生成によるアンチ・スプーフィング」によりこの問題に対処するデュアル・スポット・ディアンタングメント・ジェネレーション・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-01T15:36:59Z) - Continuous Face Aging Generative Adversarial Networks [11.75204350455584]
顔の老化は、入力画像の顔を指定された年齢に翻訳することを目的としたタスクです。
それまでの方法は、それぞれが10年からなる離散年齢群を生成できるだけに限られていた。
CFA-GAN (Continuous face aging generative adversarial Network) を提案する。
論文 参考訳(メタデータ) (2021-02-26T06:22:25Z) - PFA-GAN: Progressive Face Aging with Generative Adversarial Network [19.45760984401544]
本論文では,PFA-GANを基盤とした新しい顔老化フレームワークを提案する。
このフレームワークは、蓄積されたアーティファクトと曖昧さを取り除くために、エンドツーエンドでトレーニングすることができる。
実験により,既存の (c) GANs 法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-12-07T05:45:13Z) - Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。
本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。
提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-06T21:53:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。