論文の概要: BFRFormer: Transformer-based generator for Real-World Blind Face
Restoration
- arxiv url: http://arxiv.org/abs/2402.18811v1
- Date: Thu, 29 Feb 2024 02:31:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 16:25:19.838790
- Title: BFRFormer: Transformer-based generator for Real-World Blind Face
Restoration
- Title(参考訳): bfrformer:実世界のブラインドフェース修復のためのトランスフォーマティブ・ジェネレータ
- Authors: Guojing Ge, Qi Song, Guibo Zhu, Yuting Zhang, Jinglu Chen, Miao Xin,
Ming Tang, Jinqiao Wang
- Abstract要約: 本稿では,トランスフォーマーをベースとしたブラインドフェイス復元手法BFRFormerを提案する。
提案手法は, 合成データセットと実世界の4つのデータセットにおいて, 最先端の手法より優れる。
- 参考スコア(独自算出の注目度): 37.77996097891398
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Blind face restoration is a challenging task due to the unknown and complex
degradation. Although face prior-based methods and reference-based methods have
recently demonstrated high-quality results, the restored images tend to contain
over-smoothed results and lose identity-preserved details when the degradation
is severe. It is observed that this is attributed to short-range dependencies,
the intrinsic limitation of convolutional neural networks. To model long-range
dependencies, we propose a Transformer-based blind face restoration method,
named BFRFormer, to reconstruct images with more identity-preserved details in
an end-to-end manner. In BFRFormer, to remove blocking artifacts, the wavelet
discriminator and aggregated attention module are developed, and spectral
normalization and balanced consistency regulation are adaptively applied to
address the training instability and over-fitting problem, respectively.
Extensive experiments show that our method outperforms state-of-the-art methods
on a synthetic dataset and four real-world datasets. The source code,
Casia-Test dataset, and pre-trained models are released at
https://github.com/s8Znk/BFRFormer.
- Abstract(参考訳): ブラインドフェース修復は未知の複雑な劣化のために難しい課題である。
顔の先行法や参照法は近年,高品質な結果を示しているが,復元された画像には過度に滑らかな結果が含まれており,劣化が深刻である場合には識別保存された詳細が失われる傾向にある。
これは畳み込みニューラルネットワークの本質的な制限である短距離依存によるものと考えられる。
長距離依存をモデル化するために,トランスフォーマーをベースとしたブラインドフェイス復元手法であるBFRFormerを提案する。
BFRFormerでは、ブロッキングアーティファクトを除去するために、ウェーブレット判別器と集約アテンションモジュールを開発し、スペクトル正規化と平衡整合制御をそれぞれ適応的に適用し、トレーニングの不安定性と過度適合問題に対処する。
広範な実験により,本手法は合成データセットと実世界の4つのデータセットにおいて最先端の手法よりも優れていることが示された。
ソースコード、casia-testデータセット、事前トレーニングされたモデルはhttps://github.com/s8znk/bfrformer.com/でリリースされている。
関連論文リスト
- BlindDiff: Empowering Degradation Modelling in Diffusion Models for Blind Image Super-Resolution [52.47005445345593]
BlindDiff は SISR のブラインド劣化に対処するための DM ベースのブラインドSR 手法である。
BlindDiffはMAPベースの最適化をDMにシームレスに統合する。
合成データセットと実世界のデータセットの両方の実験は、BlindDiffが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2024-03-15T11:21:34Z) - Efficient Test-Time Adaptation for Super-Resolution with Second-Order
Degradation and Reconstruction [62.955327005837475]
画像超解像(SR)は,低分解能(LR)から高分解能(HR)へのマッピングを,一対のHR-LRトレーニング画像を用いて学習することを目的としている。
SRTTAと呼ばれるSRの効率的なテスト時間適応フレームワークを提案し、SRモデルを異なる/未知の劣化型でテストドメインに迅速に適応させることができる。
論文 参考訳(メタデータ) (2023-10-29T13:58:57Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - PRISTA-Net: Deep Iterative Shrinkage Thresholding Network for Coded
Diffraction Patterns Phase Retrieval [6.982256124089]
位相検索は、計算画像および画像処理における非線型逆問題である。
我々は,1次反復しきい値しきい値アルゴリズム(ISTA)に基づく深層展開ネットワークであるPRISTA-Netを開発した。
非線形変換,しきい値,ステップサイズなど,提案するPRISTA-Netフレームワークのパラメータはすべて,設定されるのではなく,エンドツーエンドで学習される。
論文 参考訳(メタデータ) (2023-09-08T07:37:15Z) - Exploiting Diffusion Prior for Real-World Image Super-Resolution [75.5898357277047]
本稿では,事前学習したテキスト・画像拡散モデルにカプセル化された事前知識を視覚的超解像に活用するための新しいアプローチを提案する。
時間認識エンコーダを用いることで、事前学習した合成モデルを変更することなく、有望な復元結果が得られる。
論文 参考訳(メタデータ) (2023-05-11T17:55:25Z) - Blind Super-Resolution for Remote Sensing Images via Conditional
Stochastic Normalizing Flows [14.882417028542855]
本稿では、上記の問題に対処するために、正規化フロー(BlindSRSNF)に基づく新しいブラインドSRフレームワークを提案する。
BlindSRSNFは、低解像度(LR)画像が与えられた高解像度画像空間上の条件確率分布を、確率の変動境界を明示的に最適化することによって学習する。
提案アルゴリズムは,シミュレーションLRと実世界RSIの両方において,視覚的品質の優れたSR結果が得られることを示す。
論文 参考訳(メタデータ) (2022-10-14T12:37:32Z) - Panini-Net: GAN Prior Based Degradation-Aware Feature Interpolation for
Face Restoration [4.244692655670362]
Panini-Netは、顔修復のための劣化認識機能ネットワークである。
抽象表現を学び、様々な劣化を区別する。
マルチ劣化顔復元と超解像のための最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-16T07:41:07Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。