論文の概要: WaveFace: Authentic Face Restoration with Efficient Frequency Recovery
- arxiv url: http://arxiv.org/abs/2403.12760v1
- Date: Tue, 19 Mar 2024 14:27:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-20 13:53:54.740605
- Title: WaveFace: Authentic Face Restoration with Efficient Frequency Recovery
- Title(参考訳): WaveFace: 効率的な周波数回復による認証顔復元
- Authors: Yunqi Miao, Jiankang Deng, Jungong Han,
- Abstract要約: 拡散モデルは,1) 訓練の遅さと推論速度,2) アイデンティティの保存ときめ細かい顔の詳細の復元の失敗の2つの問題で批判されている。
本稿では,ウェーブレット変換によって分解される低周波・高周波成分を個別に考慮した周波数領域の問題を解決するためにWaveFaceを提案する。
本稿では、WaveFaceが、特にアイデンティティ保存の観点から、信頼性において最先端の手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 74.73492472409447
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although diffusion models are rising as a powerful solution for blind face restoration, they are criticized for two problems: 1) slow training and inference speed, and 2) failure in preserving identity and recovering fine-grained facial details. In this work, we propose WaveFace to solve the problems in the frequency domain, where low- and high-frequency components decomposed by wavelet transformation are considered individually to maximize authenticity as well as efficiency. The diffusion model is applied to recover the low-frequency component only, which presents general information of the original image but 1/16 in size. To preserve the original identity, the generation is conditioned on the low-frequency component of low-quality images at each denoising step. Meanwhile, high-frequency components at multiple decomposition levels are handled by a unified network, which recovers complex facial details in a single step. Evaluations on four benchmark datasets show that: 1) WaveFace outperforms state-of-the-art methods in authenticity, especially in terms of identity preservation, and 2) authentic images are restored with the efficiency 10x faster than existing diffusion model-based BFR methods.
- Abstract(参考訳): 視力回復のための強力な解法として拡散モデルが増加しているが、これらは2つの問題で批判されている。
1)遅いトレーニングと推論速度、そして
2) アイデンティティの保存ときめ細かい顔の詳細の復元に失敗する。
本研究では、ウェーブレット変換によって分解される低周波成分を個別に考慮し、信頼性と効率を最大化する周波数領域の問題を解決するためにWaveFaceを提案する。
拡散モデルを適用して低周波成分のみを回収する。
元のアイデンティティを保持するため、各デノナイジングステップにおいて、低品質画像の低周波成分に生成を条件付けする。
一方、複数の分解レベルの高周波成分は統一ネットワークによって処理され、単一のステップで複雑な顔の詳細を復元する。
4つのベンチマークデータセットの評価は以下のとおりである。
1)WaveFaceは、特にアイデンティティ保存の観点から、認証における最先端の手法より優れている。
2)既存の拡散モデルに基づくBFR法よりも10倍高速に実画像が復元される。
関連論文リスト
- Efficient Face Super-Resolution via Wavelet-based Feature Enhancement Network [27.902725520665133]
顔超解像は、低解像度の顔画像から高解像度の顔画像を再構成することを目的としている。
以前は、顔の構造的特徴を抽出するためにエンコーダ・デコーダ構造を用いていた。
本稿では,ウェーブレットに基づく特徴拡張ネットワークを提案する。このネットワークは,入力特徴を高周波数成分と低周波数成分に無作為に分解することで,特徴歪みを軽減する。
論文 参考訳(メタデータ) (2024-07-29T08:03:33Z) - DiffMAC: Diffusion Manifold Hallucination Correction for High Generalization Blind Face Restoration [62.44659039265439]
視覚障害者の視力回復を支援するための拡散情報拡散フレームワークを提案する。
DiffMACは、多種多様な劣化シーンと異種ドメインにおいて、高度な顔の復元を実現する。
結果は,最先端手法よりもDiffMACの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-15T08:44:15Z) - HIR-Diff: Unsupervised Hyperspectral Image Restoration Via Improved
Diffusion Models [38.74983301496911]
ハイパースペクトル画像(HSI)の復元は、劣化した観察からクリーンなイメージを復元することを目的としている。
既存のモデルに基づく手法は、複雑な画像の特徴を正確にモデル化するのに限界がある。
本稿では,事前学習拡散モデル(HIR-Diff)を用いた教師なしHSI復元フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-24T17:15:05Z) - CLR-Face: Conditional Latent Refinement for Blind Face Restoration Using
Score-Based Diffusion Models [57.9771859175664]
最近の生成優先法は、有望なブラインドフェイス修復性能を示している。
入力に忠実なきめ細かい顔の詳細を生成することは、依然として難しい問題である。
本稿では,VQGANアーキテクチャの内部に拡散型プライマーを導入し,非破壊な潜伏埋め込みにおける分布の学習に重点を置いている。
論文 参考訳(メタデータ) (2024-02-08T23:51:49Z) - Effective Adapter for Face Recognition in the Wild [72.75516495170199]
私たちは、画像が低品質で現実世界の歪みに悩まされる、野生の顔認識の課題に取り組みます。
従来のアプローチでは、劣化した画像や、顔の復元技術を使って強化された画像を直接訓練するが、効果がないことが証明された。
高品質な顔データセットで訓練された既存の顔認識モデルを強化するための効果的なアダプタを提案する。
論文 参考訳(メタデータ) (2023-12-04T08:55:46Z) - WaveDM: Wavelet-Based Diffusion Models for Image Restoration [43.254438752311714]
Wavelet-based Diffusion Model (WaveDM) は、ウェーブレット変換後の劣化画像のウェーブレットスペクトルに条件付きウェーブレット領域におけるクリーン画像の分布を学習する。
WaveDMは、従来のワンパス手法に匹敵する効率で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-05-23T08:41:04Z) - Network Architecture Search for Face Enhancement [82.25775020564654]
我々は、NASFE(Network Architecture Search for Face Enhancement)と呼ばれるマルチタスクの顔復元ネットワークを提案する。
NASFEは、単一の劣化(すなわち)を含む低品質の顔画像を高めることができる。
ノイズまたはぼやけ)または複数の劣化(ノイズ+ブラル+ローライト)
論文 参考訳(メタデータ) (2021-05-13T19:46:05Z) - Frequency Domain Image Translation: More Photo-realistic, Better
Identity-preserving [36.606114597585396]
本稿では,周波数情報を利用した新しい周波数領域画像翻訳フレームワークを提案する。
我々のキーとなる考え方は、画像を低周波および高周波の成分に分解することであり、そこでは、高周波の特徴がアイデンティティに似たオブジェクト構造をキャプチャする。
広汎な実験と改善により、FDITはソース画像のアイデンティティを効果的に保存し、フォトリアリスティック画像を生成する。
論文 参考訳(メタデータ) (2020-11-27T08:58:56Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。