論文の概要: Latent Posterior-Mean Rectified Flow for Higher-Fidelity Perceptual Face Restoration
- arxiv url: http://arxiv.org/abs/2507.00447v1
- Date: Tue, 01 Jul 2025 06:00:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.352722
- Title: Latent Posterior-Mean Rectified Flow for Higher-Fidelity Perceptual Face Restoration
- Title(参考訳): 高忠実度知覚顔回復のための後側方側方整流流法の検討
- Authors: Xin Luo, Menglin Zhang, Yunwei Lan, Tianyu Zhang, Rui Li, Chang Liu, Dong Liu,
- Abstract要約: 後方平均整流 (PMRF) は, ソース分布が最小歪み推定値となる流れに基づく手法を提案する。
潜時PMRFは可変オートエンコーダ(VAE)の潜時空間でPMRFを再構成する
提案するVAEは,再建と修復の両面で,既存のVAEを著しく上回っている。
- 参考スコア(独自算出の注目度): 17.497971830313883
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Perception-Distortion tradeoff (PD-tradeoff) theory suggests that face restoration algorithms must balance perceptual quality and fidelity. To achieve minimal distortion while maintaining perfect perceptual quality, Posterior-Mean Rectified Flow (PMRF) proposes a flow based approach where source distribution is minimum distortion estimations. Although PMRF is shown to be effective, its pixel-space modeling approach limits its ability to align with human perception, where human perception is defined as how humans distinguish between two image distributions. In this work, we propose Latent-PMRF, which reformulates PMRF in the latent space of a variational autoencoder (VAE), facilitating better alignment with human perception during optimization. By defining the source distribution on latent representations of minimum distortion estimation, we bound the minimum distortion by the VAE's reconstruction error. Moreover, we reveal the design of VAE is crucial, and our proposed VAE significantly outperforms existing VAEs in both reconstruction and restoration. Extensive experiments on blind face restoration demonstrate the superiority of Latent-PMRF, offering an improved PD-tradeoff compared to existing methods, along with remarkable convergence efficiency, achieving a 5.79X speedup over PMRF in terms of FID. Our code will be available as open-source.
- Abstract(参考訳): 知覚歪トレードオフ(PD-Trdeoff)理論は、顔復元アルゴリズムは知覚品質と忠実さのバランスをとる必要があることを示唆している。
完全な知覚品質を維持しながら最小の歪みを抑えるため,PMRF (Posterior-Mean Rectified Flow) はソース分布が最小の歪み推定となるフローベースアプローチを提案する。
PMRFは有効であることが示されているが、そのピクセル空間モデリングアプローチは、人間の知覚と協調する能力を制限する。
本研究では,変分オートエンコーダ(VAE)の潜時空間におけるPMRFを再構成し,最適化時の人間の知覚との整合性を向上するLatent-PMRFを提案する。
最小歪み推定の潜時表現の音源分布を定義することにより,VAEの再構成誤差による最小歪みを限定する。
さらに,VAEの設計は極めて重要であり,再建と修復の両面で既存のVAEを著しく上回っていることが明らかとなった。
ブラインドフェース修復に関する広範囲な実験は、既存の方法と比較してPD-Trdeoffが改善され、FIDの点でPMRFよりも5.79倍のスピードアップを達成した。
私たちのコードはオープンソースとして公開されます。
関連論文リスト
- LAFR: Efficient Diffusion-based Blind Face Restoration via Latent Codebook Alignment Adapter [52.93785843453579]
低品質(LQ)画像からのブラインド顔復元は、高忠実度画像再構成と顔認証の保存を必要とする課題である。
LAFRは,LQ画像の潜時分布とHQ画像の潜時分布を一致させる,新しいコードブックベースの潜時空間アダプタである。
FFHQデータセットのわずか0.9%での拡散の軽量な微調整は、最先端の手法に匹敵する結果を得るのに十分であることを示す。
論文 参考訳(メタデータ) (2025-05-29T14:11:16Z) - Traversing Distortion-Perception Tradeoff using a Single Score-Based Generative Model [35.91741991271154]
歪み知覚トレードオフは、歪みメトリクスと知覚品質の根本的な矛盾を明らかにします。
本稿では,1つのスコアネットワークがDPトレードオフを効果的かつ柔軟に越えられることを示す。
論文 参考訳(メタデータ) (2025-03-26T07:37:53Z) - Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration [34.50287066865267]
Posterior-Mean Rectified Flow (PMRF) は、この最適推定器を近似する単純かつ高効率なアルゴリズムである。
PMRFの理論的有用性について検討し,様々な画像復元作業において従来手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2024-10-01T05:54:07Z) - Timestep-Aware Diffusion Model for Extreme Image Rescaling [47.89362819768323]
本稿では,時間認識拡散モデル(TADM)と呼ばれる,画像再スケーリングのための新しいフレームワークを提案する。
TADMは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を行う。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文 参考訳(メタデータ) (2024-08-17T09:51:42Z) - Amortized Posterior Sampling with Diffusion Prior Distillation [55.03585818289934]
Amortized Posterior Smplingは、逆問題における効率的な後方サンプリングのための新しい変分推論手法である。
本手法は,拡散モデルにより暗黙的に定義された変動分布と後続分布とのばらつきを最小限に抑えるために条件付き流れモデルを訓練する。
既存の手法とは異なり、我々のアプローチは教師なしであり、ペア化されたトレーニングデータを必要としておらず、ユークリッドと非ユークリッドの両方のドメインに適用できる。
論文 参考訳(メタデータ) (2024-07-25T09:53:12Z) - Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文 参考訳(メタデータ) (2024-05-26T05:38:50Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - A Theory of the Distortion-Perception Tradeoff in Wasserstein Space [35.25746003630763]
推定器の歪みを下げると、その出力の分布は、推定しようとする信号の分布から逸脱する。
この現象は画像修復において顕著な関心を集めており、真理画像の忠実さは知覚品質の犠牲となる。
知覚歪トレードオフの2つの極端における推定器から推定器をどのように構築できるかを示す。
論文 参考訳(メタデータ) (2021-07-06T11:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。