Fugu-MT 論文翻訳(概要): Pluralistic Aging Diffusion Autoencoder

論文の概要: Pluralistic Aging Diffusion Autoencoder

arxiv url: http://arxiv.org/abs/2303.11086v2
Date: Thu, 24 Aug 2023 03:53:35 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-25 18:10:02.214969
Title: Pluralistic Aging Diffusion Autoencoder
Title（参考訳）: 複数の時効拡散オートエンコーダ
Authors: Peipei Li, Rui Wang, Huaibo Huang, Ran He, Zhaofeng He
Abstract要約: 顔の老化は、複数のプラプシブルな老化パターンが与えられた入力に対応する可能性があるため、不適切な問題である。本稿では,CLIP駆動型多言語時効拡散オートエンコーダを提案する。
参考スコア（独自算出の注目度）: 63.50599304294062
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Face aging is an ill-posed problem because multiple plausible aging patterns may correspond to a given input. Most existing methods often produce one deterministic estimation. This paper proposes a novel CLIP-driven Pluralistic Aging Diffusion Autoencoder (PADA) to enhance the diversity of aging patterns. First, we employ diffusion models to generate diverse low-level aging details via a sequential denoising reverse process. Second, we present Probabilistic Aging Embedding (PAE) to capture diverse high-level aging patterns, which represents age information as probabilistic distributions in the common CLIP latent space. A text-guided KL-divergence loss is designed to guide this learning. Our method can achieve pluralistic face aging conditioned on open-world aging texts and arbitrary unseen face images. Qualitative and quantitative experiments demonstrate that our method can generate more diverse and high-quality plausible aging results.
Abstract（参考訳）: 複数のプラプティブルな老化パターンが与えられた入力に対応する可能性があるため、顔の老化は不適切な問題である。ほとんどの既存手法は、しばしば一つの決定論的推定を生成する。本稿では,老化パターンの多様性を高めるために,クリップ駆動型多元的老化拡散オートエンコーダ (pada) を提案する。まず, 拡散モデルを用いて, 逐次デノージング逆プロセスを通じて, 様々な低レベルな老化詳細を生成する。第2に, 年齢情報を共通CLIP潜伏空間の確率分布として表現する多種多様な高次老化パターンを捉えるための確率的老化埋め込み(PAE)を提案する。テキスト誘導KL分割損失は、この学習を導くために設計されている。本手法は,オープンワールドの高齢化テキストと任意の未知の顔画像に基づいて,多元的顔老化を実現する。質的,定量的な実験により,より多様で高品質な老化結果が得られた。

関連論文リスト

Bridging the Discrete-Continuous Gap: Unified Multimodal Generation via Coupled Manifold Discrete Absorbing Diffusion [60.186310080523135]
離散データ(テキスト)に対する自己回帰的アプローチと連続データ(画像)に対する拡散的アプローチへの生成的モデリングの分岐は、真に統一されたマルチモーダルシステムの開発を妨げる。階層的二重プロセスとしてマルチモーダル生成を再構成する新しい確率的フレームワークである textbfCoM-DAD を提案する。提案手法は、標準的なマスキングモデルよりも優れた安定性を示し、スケーラブルで統一されたテキスト画像生成のための新しいパラダイムを確立する。
論文参考訳（メタデータ） (2026-01-07T16:21:19Z)
Identity-Preserving Aging and De-Aging of Faces in the StyleGAN Latent Space [4.852932390076274]
本稿では,StyleGAN2の潜伏空間を編集することで,老朽化した顔と老朽化した顔の合成を提案する。次に、入力面のID保存を保証するため、年齢/年齢パラメータの制限を推定する式を提案する。提案手法と推定パラメータは, 年齢差認識, 年齢保証システム, 合成画像検出システムなどのベンチマークに利用することができる。
論文参考訳（メタデータ） (2025-08-12T10:02:42Z)
The Aging Multiverse: Generating Condition-Aware Facial Aging Tree via Training-Free Diffusion [7.536205940569963]
一つの画像から複数の可塑性顔の老化軌跡を生成するためのフレームワークであるAging Multiverseを紹介する。本研究では,アイデンティティの保存,年齢の正確さ,条件管理のバランスをとるための,学習自由拡散に基づく手法を提案する。実験とユーザスタディでは、アイデンティティ保存、高齢化リアリズム、条件付きアライメントなど、最先端のパフォーマンスが実証されている。
論文参考訳（メタデータ） (2025-06-26T04:57:47Z)
Generalized Interpolating Discrete Diffusion [65.74168524007484]
仮面拡散はその単純さと有効性のために一般的な選択である。離散拡散過程を補間する一般族の理論的バックボーンを導出する。 GIDDのフレキシビリティをエクスプロイトし、マスクと均一ノイズを組み合わせたハイブリッドアプローチを探索する。
論文参考訳（メタデータ） (2025-03-06T14:30:55Z)
MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling [64.09238330331195]
本稿では,MMAR(Multi-Modal Auto-Regressive)確率モデルフレームワークを提案する。離散化の手法とは異なり、MMARは情報損失を避けるために連続的に評価された画像トークンを取り入れる。 MMARは他のジョイントマルチモーダルモデルよりもはるかに優れた性能を示す。
論文参考訳（メタデータ） (2024-10-14T17:57:18Z)
MFCLIP: Multi-modal Fine-grained CLIP for Generalizable Diffusion Face Forgery Detection [64.29452783056253]
フォトリアリスティック・フェイスジェネレーション手法の急速な発展は、社会やアカデミックにおいて大きな関心を集めている。既存のアプローチは主に画像モダリティを用いて顔の偽造パターンをキャプチャするが、きめ細かいノイズやテキストのような他のモダリティは完全には探索されていない。そこで本研究では,画像ノイズの多点にわたる包括的かつきめ細かなフォージェリートレースをマイニングする,MFCLIP(MF-modal Fine-fine-fine-fine-fine-fine CLIP)モデルを提案する。
論文参考訳（メタデータ） (2024-09-15T13:08:59Z)
DiffAge3D: Diffusion-based 3D-aware Face Aging [61.3027596093854]
本稿では,DiffAge3Dを提案する。DiffAge3Dは3D設定で忠実な老化とアイデンティティ保存を行う最初の3D対応高齢化フレームワークである。我々のフレームワークは、トレーニング済みの3D GANを利用して、堅牢な3D対応老化データセット生成パイプラインを含む。 DiffAge3Dは既存の手法、特にマルチビューの老朽化や細部保存において優れることを示す。
論文参考訳（メタデータ） (2024-08-28T16:36:09Z)
CLR-Face: Conditional Latent Refinement for Blind Face Restoration Using Score-Based Diffusion Models [57.9771859175664]
最近の生成優先法は、有望なブラインドフェイス修復性能を示している。入力に忠実なきめ細かい顔の詳細を生成することは、依然として難しい問題である。本稿では,VQGANアーキテクチャの内部に拡散型プライマーを導入し,非破壊な潜伏埋め込みにおける分布の学習に重点を置いている。
論文参考訳（メタデータ） (2024-02-08T23:51:49Z)
Diverse and Lifespan Facial Age Transformation Synthesis with Identity Variation Rationality Metric [12.438204529412706]
人間の顔にディバース・ライフスパン・エイジ・トランスフォーメーションを実現するために、$rmDLATboldsymbol+$を導入する。モデルに埋め込まれた多様性のメカニズムとは別に、複数の一貫性の制限が活用され、反ファクト的な老化合成を防ぐことができる。
論文参考訳（メタデータ） (2024-01-25T09:26:08Z)
CILF-CIAE: CLIP-driven Image-Language Fusion for Correcting Inverse Age Estimation [14.639340916340801]
年齢推定タスクは、画像中の顔の特徴を分析して、個人の年齢を予測することを目的としている。既存のCLIPベースの年齢推定手法では、高いメモリ使用量が必要であり、エラーフィードバック機構が欠如している。逆年齢推定(CILF-CIAE)のための新しいCLIP駆動画像言語融合法を提案する。
論文参考訳（メタデータ） (2023-12-04T09:35:36Z)
Face Aging via Diffusion-based Editing [5.318584973533008]
FAdingは,Diffusion-based editiNGによる顔の老化に対処するための新しいアプローチである。我々は、大規模言語画像拡散モデルのリッチな事前利用により、既存の手法を超越する。提案手法は, 経年的精度, 属性保存, 経年的品質に関して, 既存の手法よりも優れている。
論文参考訳（メタデータ） (2023-09-20T13:47:10Z)
Continuous Face Aging Generative Adversarial Networks [11.75204350455584]
顔の老化は、入力画像の顔を指定された年齢に翻訳することを目的としたタスクです。それまでの方法は、それぞれが10年からなる離散年齢群を生成できるだけに限られていた。 CFA-GAN (Continuous face aging generative adversarial Network) を提案する。
論文参考訳（メタデータ） (2021-02-26T06:22:25Z)
PFA-GAN: Progressive Face Aging with Generative Adversarial Network [19.45760984401544]
本論文では,PFA-GANを基盤とした新しい顔老化フレームワークを提案する。このフレームワークは、蓄積されたアーティファクトと曖昧さを取り除くために、エンドツーエンドでトレーニングすることができる。実験により,既存の (c) GANs 法よりも優れた性能を示した。
論文参考訳（メタデータ） (2020-12-07T05:45:13Z)
Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文参考訳（メタデータ） (2020-06-06T21:53:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。