論文の概要: A2BFR: Attribute-Aware Blind Face Restoration
- arxiv url: http://arxiv.org/abs/2603.29423v1
- Date: Tue, 31 Mar 2026 08:29:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.353233
- Title: A2BFR: Attribute-Aware Blind Face Restoration
- Title(参考訳): A2BFR:属性対応のブラインド顔復元
- Authors: Chenxin Zhu, Yushun Fang, Lu Liu, Shibo Yin, Xiaohong Liu, Xiaoyun Zhang, Qiang Hu, Guangtao Zhai,
- Abstract要約: ブラインド顔復元(BFR)は、劣化した入力から高品質な顔画像の復元を目的としている。
近年の拡散型BFR法は知覚品質を向上させるが制御不能である。
本稿では,属性を意識したBFRフレームワークであるA$2$BFRを提案する。
- 参考スコア(独自算出の注目度): 48.06304429343643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Blind face restoration (BFR) aims to recover high-quality facial images from degraded inputs, yet its inherently ill-posed nature leads to ambiguous and uncontrollable solutions. Recent diffusion-based BFR methods improve perceptual quality but remain uncontrollable, whereas text-guided face editing enables attribute manipulation without reliable restoration. To address these issues, we propose A$^2$BFR, an attribute-aware blind face restoration framework that unifies high-fidelity reconstruction with prompt-controllable generation. Built upon a Diffusion Transformer backbone with unified image-text cross-modal attention, A$^2$BFR jointly conditions the denoising trajectory on both degraded inputs and textual prompts. To inject semantic priors, we introduce attribute-aware learning, which supervises denoising latents using facial attribute embeddings extracted by an attribute-aware encoder. To further enhance prompt controllability, we introduce semantic dual-training, which leverages the pairwise attribute variations in our newly curated AttrFace-90K dataset to enforce attribute discrimination while preserving fidelity. Extensive experiments demonstrate that A$^2$BFR achieves state-of-the-art performance in both restoration fidelity and instruction adherence, outperforming diffusion-based BFR baselines by -0.0467 LPIPS and +52.58% attribute accuracy, while enabling fine-grained, prompt-controllable restoration even under severe degradations.
- Abstract(参考訳): ブラインド顔復元(BFR)は、劣化した入力から高品質な顔画像を復元することを目的としている。
近年の拡散型BFR法では知覚品質が向上するが制御不能である。
これらの問題に対処するために,属性対応のブラインドフェイス復元フレームワークであるA$^2$BFRを提案する。
Diffusion Transformerのバックボーン上に構築され、画像-テキストのクロスモーダルな注意を統一したもので、A$^2$BFRは劣化した入力とテキストプロンプトの両方にデノイングの軌跡を共同で条件付けする。
本稿では,属性認識エンコーダによって抽出された顔属性の埋め込みを用いて,潜伏者の聴覚を指導する属性認識学習を提案する。
そこで我々は,新たにキュレートしたAttrFace-90Kデータセットの2値属性の変動を利用したセマンティックデュアルトレーニングを導入する。
大規模な実験により、A$^2$BFRは、修復の忠実さと命令の付着性の両方において最先端のパフォーマンスを達成し、拡散ベースのBFRベースラインを-0.0467 LPIPSと+52.58%の属性精度で上回り、深刻な劣化下でもきめ細かな、即時制御可能な復元を可能にした。
関連論文リスト
- LAFR: Efficient Diffusion-based Blind Face Restoration via Latent Codebook Alignment Adapter [52.93785843453579]
低品質(LQ)画像からのブラインド顔復元は、高忠実度画像再構成と顔認証の保存を必要とする課題である。
LAFRは,LQ画像の潜時分布とHQ画像の潜時分布を一致させる,新しいコードブックベースの潜時空間アダプタである。
FFHQデータセットのわずか0.9%での拡散の軽量な微調整は、最先端の手法に匹敵する結果を得るのに十分であることを示す。
論文 参考訳(メタデータ) (2025-05-29T14:11:16Z) - DR-BFR: Degradation Representation with Diffusion Models for Blind Face Restoration [7.521850476177286]
低品質 (LQ) の顔画像から様々な劣化を分解する能力を持つ拡散モデルを開発した。
DR-BFRと呼ばれる新しい修復手法は、劣化表現(DR)とLQ画像からのコンテンツ特徴を取り入れることで、遅延拡散モデル(LDM)の認知を導く。
DR-BFRは、様々なデータセットに対して定量的かつ質的に最先端の手法を著しく上回る。
論文 参考訳(メタデータ) (2024-11-15T15:24:42Z) - BFRFormer: Transformer-based generator for Real-World Blind Face
Restoration [37.77996097891398]
本稿では,トランスフォーマーをベースとしたブラインドフェイス復元手法BFRFormerを提案する。
提案手法は, 合成データセットと実世界の4つのデータセットにおいて, 最先端の手法より優れる。
論文 参考訳(メタデータ) (2024-02-29T02:31:54Z) - CLR-Face: Conditional Latent Refinement for Blind Face Restoration Using
Score-Based Diffusion Models [57.9771859175664]
最近の生成優先法は、有望なブラインドフェイス修復性能を示している。
入力に忠実なきめ細かい顔の詳細を生成することは、依然として難しい問題である。
本稿では,VQGANアーキテクチャの内部に拡散型プライマーを導入し,非破壊な潜伏埋め込みにおける分布の学習に重点を置いている。
論文 参考訳(メタデータ) (2024-02-08T23:51:49Z) - DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior [70.46245698746874]
DiffBIRは、視覚の異なる画像復元タスクを処理できる一般的な修復パイプラインである。
DiffBIRは, ブラインド画像復元問題を, 1) 劣化除去: 画像に依存しない内容の除去; 2) 情報再生: 失われた画像内容の生成の2段階に分離する。
第1段階では, 修復モジュールを用いて劣化を除去し, 高忠実度復元結果を得る。
第2段階では、潜伏拡散モデルの生成能力を活用して現実的な詳細を生成するIRControlNetを提案する。
論文 参考訳(メタデータ) (2023-08-29T07:11:52Z) - Implicit Subspace Prior Learning for Dual-Blind Face Restoration [66.67059961379923]
新しい暗黙的サブスペース事前学習(ISPL)フレームワークが、二重盲顔復元の一般的な解決策として提案されている。
実験の結果,既存の最先端手法に対するISPLの認識歪改善が顕著であった。
論文 参考訳(メタデータ) (2020-10-12T08:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。