論文の概要: Network Architecture Search for Face Enhancement
- arxiv url: http://arxiv.org/abs/2105.06528v1
- Date: Thu, 13 May 2021 19:46:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-17 12:45:13.211692
- Title: Network Architecture Search for Face Enhancement
- Title(参考訳): 顔強調のためのネットワークアーキテクチャ探索
- Authors: Rajeev Yasarla, Hamid Reza Vaezi Joze, and Vishal M Patel
- Abstract要約: 我々は、NASFE(Network Architecture Search for Face Enhancement)と呼ばれるマルチタスクの顔復元ネットワークを提案する。
NASFEは、単一の劣化(すなわち)を含む低品質の顔画像を高めることができる。
ノイズまたはぼやけ)または複数の劣化(ノイズ+ブラル+ローライト)
- 参考スコア(独自算出の注目度): 82.25775020564654
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various factors such as ambient lighting conditions, noise, motion blur, etc.
affect the quality of captured face images. Poor quality face images often
reduce the performance of face analysis and recognition systems. Hence, it is
important to enhance the quality of face images collected in such conditions.
We present a multi-task face restoration network, called Network Architecture
Search for Face Enhancement (NASFE), which can enhance poor quality face images
containing a single degradation (i.e. noise or blur) or multiple degradations
(noise+blur+low-light). During training, NASFE uses clean face images of a
person present in the degraded image to extract the identity information in
terms of features for restoring the image. Furthermore, the network is guided
by an identity-loss so that the identity in-formation is maintained in the
restored image. Additionally, we propose a network architecture search-based
fusion network in NASFE which fuses the task-specific features that are
extracted using the task-specific encoders. We introduce FFT-op and deveiling
operators in the fusion network to efficiently fuse the task-specific features.
Comprehensive experiments on synthetic and real images demonstrate that the
proposed method outperforms many recent state-of-the-art face restoration and
enhancement methods in terms of quantitative and visual performance.
- Abstract(参考訳): 周囲の照明条件、騒音、動きのぼやけなど、様々な要因がある。
捉えた顔の画質に影響を与えます
品質の悪い顔画像は、しばしば顔分析と認識システムの性能を低下させる。
したがって,このような状況下で収集した顔画像の品質を高めることが重要である。
本稿では,NASFE (Network Architecture Search for Face Enhancement) と呼ばれるマルチタスクの顔復元ネットワークを提案する。
ノイズやぼやけ)、あるいは複数の劣化(ノイズ+ブラル+ローライト)。
トレーニング中、NASFEは劣化した画像に存在する人物のきれいな顔画像を使用して、画像の復元のための特徴の観点から識別情報を抽出する。
さらに、ネットワークは、復元された画像においてアイデンティティインフォーメーションが維持されるようにid損失によって誘導される。
さらに,タスク固有のエンコーダを用いて抽出されるタスク固有の特徴を融合するNASFEにおけるネットワークアーキテクチャ検索に基づく融合ネットワークを提案する。
本稿では,fft-op および deveiling operator を fusion network に導入し,タスク固有の機能を効率的に融合する。
合成画像および実画像に関する包括的実験により, 提案手法は, 定量的, 視覚的性能の面で, 最新の顔復元法, 強化法を上回っていることが示された。
関連論文リスト
- OSDFace: One-Step Diffusion Model for Face Restoration [72.5045389847792]
拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-26T07:07:48Z) - W-Net: A Facial Feature-Guided Face Super-Resolution Network [8.037821981254389]
Face Super-Resolutionは、高解像度 (HR) の顔画像を低解像度 (LR) の顔画像から復元することを目的としている。
既存手法は, 再建効率が低く, 事前情報の利用が不十分であるため, 理想的ではない。
本稿では,この課題に対処するため,W-Netと呼ばれる新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-06-02T09:05:40Z) - Multi-Prior Learning via Neural Architecture Search for Blind Face
Restoration [61.27907052910136]
Blind Face Restoration (BFR)は、高品質な顔画像から高品質な顔画像を復元することを目的としている。
1)手動チューニングを伴わない強力なネットワークアーキテクチャの導出方法,2) 複数の顔前者からの補完情報を1つのネットワークで取得して復元性能を向上させる方法,の2つの大きな課題がある。
特定検索空間内において,適切な特徴抽出アーキテクチャを適応的に探索する顔復元検索ネットワーク(FRSNet)を提案する。
論文 参考訳(メタデータ) (2022-06-28T12:29:53Z) - Detecting High-Quality GAN-Generated Face Images using Neural Networks [23.388645531702597]
本稿では,スペクトル帯域差を利用したGAN生成画像と実画像との区別手法を提案する。
特に,クロスバンド共起行列と空間共起行列を用いて,顔画像のデジタル保存を可能にする。
性能向上は特に重要であり、異なる後処理環境において92%以上を達成することを示す。
論文 参考訳(メタデータ) (2022-03-03T13:53:27Z) - LTT-GAN: Looking Through Turbulence by Inverting GANs [86.25869403782957]
本稿では,よく訓練されたGANによってカプセル化された視覚的事前情報を利用した最初の乱流緩和手法を提案する。
視覚的先行性に基づき、周期的な文脈距離で復元された画像の同一性を維持することを学ぶことを提案する。
本手法は, 回復した結果の視覚的品質と顔認証精度の両方において, 先行技術よりも優れていた。
論文 参考訳(メタデータ) (2021-12-04T16:42:13Z) - JDSR-GAN: Constructing A Joint and Collaborative Learning Network for
Masked Face Super-Resolution [28.022800882214803]
ほとんどのビデオ監視シナリオで得られた顔画像は、マスクと同時に低解像度です。
これまでのスーパーレゾリューションソリューションのほとんどは、1つのモデルで両方のタスクを処理できない。
我々は,マスク付き顔超解像課題のための共同学習ネットワークJDSR-GANを構築した。
論文 参考訳(メタデータ) (2021-03-25T08:50:40Z) - Learning Spatial Attention for Face Super-Resolution [28.60619685892613]
一般画像超解像技術は、低解像度の顔画像に適用する場合、詳細な顔構造を復元することが困難である。
近年,顔画像に適した深層学習手法は,顔解析やランドマーク予測などのタスクを共同で訓練することで,性能の向上を実現している。
顔超解像のための新たに提案した顔注意ユニット(FAUs)上に構築したSPatial Attention Residual Network(SPARNet)を紹介する。
論文 参考訳(メタデータ) (2020-12-02T13:54:25Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z) - Exploiting Semantics for Face Image Deblurring [121.44928934662063]
本稿では,深層畳み込みニューラルネットワークによる意味的手がかりを利用して,効果的かつ効率的な顔分解アルゴリズムを提案する。
顔のセマンティックラベルを入力先として組み込んで,顔の局所構造を正規化するための適応的構造損失を提案する。
提案手法は、より正確な顔の特徴と細部を持つシャープ画像を復元する。
論文 参考訳(メタデータ) (2020-01-19T13:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。