論文の概要: Dual Associated Encoder for Face Restoration
- arxiv url: http://arxiv.org/abs/2308.07314v2
- Date: Sun, 21 Jan 2024 04:07:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 21:17:40.638864
- Title: Dual Associated Encoder for Face Restoration
- Title(参考訳): 顔修復用デュアル関連エンコーダ
- Authors: Yu-Ju Tsai, Yu-Lun Liu, Lu Qi, Kelvin C.K. Chan, Ming-Hsuan Yang
- Abstract要約: 低品質(LQ)画像から顔の詳細を復元するために,DAEFRという新しいデュアルブランチフレームワークを提案する。
提案手法では,LQ入力から重要な情報を抽出する補助的なLQ分岐を導入する。
合成と実世界の両方のデータセットに対するDAEFRの有効性を評価する。
- 参考スコア(独自算出の注目度): 68.49568459672076
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Restoring facial details from low-quality (LQ) images has remained a
challenging problem due to its ill-posedness induced by various degradations in
the wild. The existing codebook prior mitigates the ill-posedness by leveraging
an autoencoder and learned codebook of high-quality (HQ) features, achieving
remarkable quality. However, existing approaches in this paradigm frequently
depend on a single encoder pre-trained on HQ data for restoring HQ images,
disregarding the domain gap between LQ and HQ images. As a result, the encoding
of LQ inputs may be insufficient, resulting in suboptimal performance. To
tackle this problem, we propose a novel dual-branch framework named DAEFR. Our
method introduces an auxiliary LQ branch that extracts crucial information from
the LQ inputs. Additionally, we incorporate association training to promote
effective synergy between the two branches, enhancing code prediction and
output quality. We evaluate the effectiveness of DAEFR on both synthetic and
real-world datasets, demonstrating its superior performance in restoring facial
details. Project page: https://liagm.github.io/DAEFR/
- Abstract(参考訳): 低品質(LQ)画像から顔の細部を復元することは、野生の様々な劣化によって引き起こされる不作為、依然として困難な問題である。
既存のコードブックは、オートエンコーダと高品質(HQ)機能の学習コードブックを活用することで、予期せぬ品質を達成することで、その不備を軽減します。
しかし、このパラダイムの既存のアプローチは、LQとHQイメージ間のドメインギャップを無視して、HQイメージの復元のためにHQデータに事前訓練された単一のエンコーダに依存することが多い。
結果として、LQ入力の符号化が不十分になり、最適化性能が低下する可能性がある。
そこで本研究では,DAEFRという新しいデュアルブランチフレームワークを提案する。
提案手法では,LQ入力から重要な情報を抽出する補助的なLQ分岐を導入する。
さらに,2つのブランチ間の効果的なシナジーを促進し,コード予測と出力品質を向上させるためのアソシエーショントレーニングも取り入れた。
合成および実世界のデータセットにおけるDAEFRの有効性を評価し,顔の詳細の復元において優れた性能を示す。
プロジェクトページ: https://liagm.github.io/DAEFR/
関連論文リスト
- CLR-Face: Conditional Latent Refinement for Blind Face Restoration Using
Score-Based Diffusion Models [57.9771859175664]
最近の生成優先法は、有望なブラインドフェイス修復性能を示している。
入力に忠実なきめ細かい顔の詳細を生成することは、依然として難しい問題である。
本稿では,VQGANアーキテクチャの内部に拡散型プライマーを導入し,非破壊な潜伏埋め込みにおける分布の学習に重点を置いている。
論文 参考訳(メタデータ) (2024-02-08T23:51:49Z) - VQCNIR: Clearer Night Image Restoration with Vector-Quantized Codebook [16.20461368096512]
夜景撮影は、暗い環境や長時間の露光から生じる、暗い光やぼやけなどの課題に苦しむことが多い。
私たちは、データ駆動の高品質な事前処理の強みを信じ、手動による事前処理の制限を回避するために、信頼性と一貫性のある事前処理の提供に努めています。
VQCNIR(Vector-Quantized Codebook)を用いたClearer Night Image Restorationを提案する。
論文 参考訳(メタデータ) (2023-12-14T02:16:27Z) - HQG-Net: Unpaired Medical Image Enhancement with High-Quality Guidance [45.84780456554191]
Unpaired Medical Image Enhancement (UMIE)は、低品質(LQ)の医用画像から高品質(HQ)の画像に変換することを目的としている。
本稿では, HQ cues を直接 LQ エンハンスメントプロセスに符号化することで, 既存の手法の制限を回避する新しい UMIE 手法を提案する。
我々は、生成したHQイメージがHQドメインに落下することを確実にするために、差別者と反対に拡張ネットワークを訓練する。
論文 参考訳(メタデータ) (2023-07-15T15:26:25Z) - Collaborative Auto-encoding for Blind Image Quality Assessment [17.081262827258943]
ブラインド画像品質評価(BIQA)は、重要な現実世界のアプリケーションにおいて難しい問題である。
近年、ディープニューラルネットワーク(DNN)による強力な表現を活用しようとする試みは、主観的な注釈付きデータの欠如によって妨げられている。
本稿では,この基本的な障害を克服する新しいBIQA法を提案する。
論文 参考訳(メタデータ) (2023-05-24T03:45:03Z) - Towards Accurate Image Coding: Improved Autoregressive Image Generation
with Dynamic Vector Quantization [73.52943587514386]
既存のベクトル量子化(VQ)ベースの自己回帰モデルは、2段階生成パラダイムに従う。
画像領域を可変長符号に符号化する動的量子化VAE(DQ-VAE)を提案する。
論文 参考訳(メタデータ) (2023-05-19T14:56:05Z) - RIDCP: Revitalizing Real Image Dehazing via High-Quality Codebook Priors [14.432465539590481]
既存のデハジングアプローチは、ペアの実際のデータと堅牢な事前処理が欠如しているため、現実のハジーなイメージを処理するのに苦労している。
よりリアルなヘイズデータを合成する観点から、実画像のデハジングのための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-04-08T12:12:24Z) - Towards Robust Blind Face Restoration with Codebook Lookup Transformer [94.48731935629066]
ブラインドフェイスの修復は、しばしば補助的なガイダンスを必要とする非常に不適切な問題である。
学習した個別のコードブックを小さなプロキシ空間に配置し,ブラインドフェイスの復元をコード予測タスクとすることを示す。
我々は、低品質顔のグローバルな構成とコンテキストをモデル化するトランスフォーマーベースの予測ネットワーク、CodeFormerを提案する。
論文 参考訳(メタデータ) (2022-06-22T17:58:01Z) - VQFR: Blind Face Restoration with Vector-Quantized Dictionary and
Parallel Decoder [83.63843671885716]
本稿では,VQFRを用いた顔復元手法を提案する。
VQFRは高品質な顔から抽出された高品質の低レベル特徴バンクを利用する。
VQコードブックから生成されたリアルな詳細を「汚染」せず、入力から低レベルな特徴をさらに融合させるため、並列デコーダを提案する。
論文 参考訳(メタデータ) (2022-05-13T17:54:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。