論文の概要: DiffusionReward: Enhancing Blind Face Restoration through Reward Feedback Learning
- arxiv url: http://arxiv.org/abs/2505.17910v1
- Date: Fri, 23 May 2025 13:53:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:34.123529
- Title: DiffusionReward: Enhancing Blind Face Restoration through Reward Feedback Learning
- Title(参考訳): Diffusion Reward:Reward Feedback Learningによるブラインド顔修復の強化
- Authors: Bin Wu, Wei Wang, Yahui Liu, Zixiang Li, Yao Zhao,
- Abstract要約: DiffusionRewardという名前のReFLフレームワークをBlind Face Restorationタスクに初めて導入する。
私たちのフレームワークの中核はFace Reward Model(FRM)です。
合成およびワイルドデータセットの実験により,本手法が最先端の手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 40.641049729447175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reward Feedback Learning (ReFL) has recently shown great potential in aligning model outputs with human preferences across various generative tasks. In this work, we introduce a ReFL framework, named DiffusionReward, to the Blind Face Restoration task for the first time. DiffusionReward effectively overcomes the limitations of diffusion-based methods, which often fail to generate realistic facial details and exhibit poor identity consistency. The core of our framework is the Face Reward Model (FRM), which is trained using carefully annotated data. It provides feedback signals that play a pivotal role in steering the optimization process of the restoration network. In particular, our ReFL framework incorporates a gradient flow into the denoising process of off-the-shelf face restoration methods to guide the update of model parameters. The guiding gradient is collaboratively determined by three aspects: (i) the FRM to ensure the perceptual quality of the restored faces; (ii) a regularization term that functions as a safeguard to preserve generative diversity; and (iii) a structural consistency constraint to maintain facial fidelity. Furthermore, the FRM undergoes dynamic optimization throughout the process. It not only ensures that the restoration network stays precisely aligned with the real face manifold, but also effectively prevents reward hacking. Experiments on synthetic and wild datasets demonstrate that our method outperforms state-of-the-art methods, significantly improving identity consistency and facial details. The source codes, data, and models are available at: https://github.com/01NeuralNinja/DiffusionReward.
- Abstract(参考訳): Reward Feedback Learning (ReFL)は、最近、モデル出力を様々な生成タスクで人間の好みに合わせる大きな可能性を示している。
本研究では,Blind Face RestorationタスクにDiffusionRewardというReFLフレームワークを初めて導入する。
DiffusionRewardは拡散に基づく手法の限界を効果的に克服する。
私たちのフレームワークの中核はFace Reward Model(FRM)です。
復元ネットワークの最適化プロセスを操る上で重要な役割を果たすフィードバック信号を提供する。
特に、我々のReFLフレームワークは、モデルパラメータの更新をガイドするオフザシェルフフェイス復元法のデノナイズプロセスに勾配流を組み込んでいる。
誘導勾配は3つの側面によって協調的に決定される。
一 回復した顔の知覚品質を確保するためのFRM
二 生殖多様性の保護のための保護として機能する正規化用語及び
三 顔の忠実性を維持するための構造的一貫性の制約。
さらに、FRMはプロセス全体を通して動的最適化を行う。
修復ネットワークが実際の顔多様体と正確に一致していることを保証するだけでなく、報酬のハッキングを効果的に防ぐことができる。
合成およびワイルドデータセットの実験により、我々の手法は最先端の手法よりも優れ、アイデンティティの整合性と顔の細部を大幅に改善することを示した。
ソースコード、データ、モデルは、https://github.com/01NeuralNinja/DiffusionReward.comで入手できる。
関連論文リスト
- OSDFace: One-Step Diffusion Model for Face Restoration [72.5045389847792]
拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-26T07:07:48Z) - 3D Priors-Guided Diffusion for Blind Face Restoration [30.94188504133298]
劣化した顔画像から鮮明な顔画像を復元するためのブラインド顔復元作業。
近年,GAN(Generative Adversarial Networks)を先行するアプローチが顕著な成功を収めている。
本稿では,3次元顔前処理を構造的制約と同一性制約として組み込んだ拡散に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-02T07:13:32Z) - Timestep-Aware Diffusion Model for Extreme Image Rescaling [47.89362819768323]
本稿では,時間認識拡散モデル(TADM)と呼ばれる,画像再スケーリングのための新しいフレームワークを提案する。
TADMは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を行う。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文 参考訳(メタデータ) (2024-08-17T09:51:42Z) - BFRFormer: Transformer-based generator for Real-World Blind Face
Restoration [37.77996097891398]
本稿では,トランスフォーマーをベースとしたブラインドフェイス復元手法BFRFormerを提案する。
提案手法は, 合成データセットと実世界の4つのデータセットにおいて, 最先端の手法より優れる。
論文 参考訳(メタデータ) (2024-02-29T02:31:54Z) - CLR-Face: Conditional Latent Refinement for Blind Face Restoration Using
Score-Based Diffusion Models [57.9771859175664]
最近の生成優先法は、有望なブラインドフェイス修復性能を示している。
入力に忠実なきめ細かい顔の詳細を生成することは、依然として難しい問題である。
本稿では,VQGANアーキテクチャの内部に拡散型プライマーを導入し,非破壊な潜伏埋め込みにおける分布の学習に重点を置いている。
論文 参考訳(メタデータ) (2024-02-08T23:51:49Z) - DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior [70.46245698746874]
DiffBIRは、視覚の異なる画像復元タスクを処理できる一般的な修復パイプラインである。
DiffBIRは, ブラインド画像復元問題を, 1) 劣化除去: 画像に依存しない内容の除去; 2) 情報再生: 失われた画像内容の生成の2段階に分離する。
第1段階では, 修復モジュールを用いて劣化を除去し, 高忠実度復元結果を得る。
第2段階では、潜伏拡散モデルの生成能力を活用して現実的な詳細を生成するIRControlNetを提案する。
論文 参考訳(メタデータ) (2023-08-29T07:11:52Z) - DifFace: Blind Face Restoration with Diffused Error Contraction [62.476329680424975]
DifFaceは、複雑な損失設計なしで、目に見えない複雑な劣化にもっと優しく対処できる。
現在の最先端の手法よりも優れており、特に深刻な劣化の場合には優れている。
論文 参考訳(メタデータ) (2022-12-13T11:52:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。