論文の概要: Latent Posterior-Mean Rectified Flow for Higher-Fidelity Perceptual Face Restoration
- arxiv url: http://arxiv.org/abs/2507.00447v1
- Date: Tue, 01 Jul 2025 06:00:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.352722
- Title: Latent Posterior-Mean Rectified Flow for Higher-Fidelity Perceptual Face Restoration
- Title(参考訳): 高忠実度知覚顔回復のための後側方側方整流流法の検討
- Authors: Xin Luo, Menglin Zhang, Yunwei Lan, Tianyu Zhang, Rui Li, Chang Liu, Dong Liu,
- Abstract要約: 後方平均整流 (PMRF) は, ソース分布が最小歪み推定値となる流れに基づく手法を提案する。
潜時PMRFは可変オートエンコーダ(VAE)の潜時空間でPMRFを再構成する
提案するVAEは,再建と修復の両面で,既存のVAEを著しく上回っている。
- 参考スコア(独自算出の注目度): 17.497971830313883
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Perception-Distortion tradeoff (PD-tradeoff) theory suggests that face restoration algorithms must balance perceptual quality and fidelity. To achieve minimal distortion while maintaining perfect perceptual quality, Posterior-Mean Rectified Flow (PMRF) proposes a flow based approach where source distribution is minimum distortion estimations. Although PMRF is shown to be effective, its pixel-space modeling approach limits its ability to align with human perception, where human perception is defined as how humans distinguish between two image distributions. In this work, we propose Latent-PMRF, which reformulates PMRF in the latent space of a variational autoencoder (VAE), facilitating better alignment with human perception during optimization. By defining the source distribution on latent representations of minimum distortion estimation, we bound the minimum distortion by the VAE's reconstruction error. Moreover, we reveal the design of VAE is crucial, and our proposed VAE significantly outperforms existing VAEs in both reconstruction and restoration. Extensive experiments on blind face restoration demonstrate the superiority of Latent-PMRF, offering an improved PD-tradeoff compared to existing methods, along with remarkable convergence efficiency, achieving a 5.79X speedup over PMRF in terms of FID. Our code will be available as open-source.
- Abstract(参考訳): 知覚歪トレードオフ(PD-Trdeoff)理論は、顔復元アルゴリズムは知覚品質と忠実さのバランスをとる必要があることを示唆している。
完全な知覚品質を維持しながら最小の歪みを抑えるため,PMRF (Posterior-Mean Rectified Flow) はソース分布が最小の歪み推定となるフローベースアプローチを提案する。
PMRFは有効であることが示されているが、そのピクセル空間モデリングアプローチは、人間の知覚と協調する能力を制限する。
本研究では,変分オートエンコーダ(VAE)の潜時空間におけるPMRFを再構成し,最適化時の人間の知覚との整合性を向上するLatent-PMRFを提案する。
最小歪み推定の潜時表現の音源分布を定義することにより,VAEの再構成誤差による最小歪みを限定する。
さらに,VAEの設計は極めて重要であり,再建と修復の両面で既存のVAEを著しく上回っていることが明らかとなった。
ブラインドフェース修復に関する広範囲な実験は、既存の方法と比較してPD-Trdeoffが改善され、FIDの点でPMRFよりも5.79倍のスピードアップを達成した。
私たちのコードはオープンソースとして公開されます。
関連論文リスト
- Traversing Distortion-Perception Tradeoff using a Single Score-Based Generative Model [35.91741991271154]
歪み知覚トレードオフは、歪みメトリクスと知覚品質の根本的な矛盾を明らかにします。
本稿では,1つのスコアネットワークがDPトレードオフを効果的かつ柔軟に越えられることを示す。
論文 参考訳(メタデータ) (2025-03-26T07:37:53Z) - Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration [34.50287066865267]
Posterior-Mean Rectified Flow (PMRF) は、この最適推定器を近似する単純かつ高効率なアルゴリズムである。
PMRFの理論的有用性について検討し,様々な画像復元作業において従来手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2024-10-01T05:54:07Z) - Timestep-Aware Diffusion Model for Extreme Image Rescaling [47.89362819768323]
本稿では,時間認識拡散モデル(TADM)と呼ばれる,画像再スケーリングのための新しいフレームワークを提案する。
TADMは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を行う。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文 参考訳(メタデータ) (2024-08-17T09:51:42Z) - Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文 参考訳(メタデータ) (2024-05-26T05:38:50Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。