論文の概要: Blind Face Restoration: Benchmark Datasets and a Baseline Model
- arxiv url: http://arxiv.org/abs/2206.03697v1
- Date: Wed, 8 Jun 2022 06:34:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-09 13:55:12.090524
- Title: Blind Face Restoration: Benchmark Datasets and a Baseline Model
- Title(参考訳): blind face restoration:ベンチマークデータセットとベースラインモデル
- Authors: Puyang Zhang, Kaihao Zhang, Wenhan Luo, Changsheng Li, Guoren Wang
- Abstract要約: Blind Face Restoration (BFR) は、対応する低品質 (LQ) 入力から高品質 (HQ) の顔画像を構築することを目的としている。
EDFace-Celeb-1M (BFR128) と EDFace-Celeb-150K (BFR512) と呼ばれる2つのブラインドフェイス復元ベンチマークデータセットを最初に合成する。
最先端の手法は、ブラー、ノイズ、低解像度、JPEG圧縮アーティファクト、それらの組み合わせ(完全な劣化)の5つの設定でベンチマークされる。
- 参考スコア(独自算出の注目度): 63.053331687284064
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Blind Face Restoration (BFR) aims to construct a high-quality (HQ) face image
from its corresponding low-quality (LQ) input. Recently, many BFR methods have
been proposed and they have achieved remarkable success. However, these methods
are trained or evaluated on privately synthesized datasets, which makes it
infeasible for the subsequent approaches to fairly compare with them. To
address this problem, we first synthesize two blind face restoration benchmark
datasets called EDFace-Celeb-1M (BFR128) and EDFace-Celeb-150K (BFR512).
State-of-the-art methods are benchmarked on them under five settings including
blur, noise, low resolution, JPEG compression artifacts, and the combination of
them (full degradation). To make the comparison more comprehensive, five
widely-used quantitative metrics and two task-driven metrics including Average
Face Landmark Distance (AFLD) and Average Face ID Cosine Similarity (AFICS) are
applied. Furthermore, we develop an effective baseline model called Swin
Transformer U-Net (STUNet). The STUNet with U-net architecture applies an
attention mechanism and a shifted windowing scheme to capture long-range pixel
interactions and focus more on significant features while still being trained
efficiently. Experimental results show that the proposed baseline method
performs favourably against the SOTA methods on various BFR tasks.
- Abstract(参考訳): Blind Face Restoration (BFR)は、対応する低品質(LQ)入力から高品質(HQ)フェイスイメージを構築することを目的としている。
近年,多くのBFR法が提案され,大きな成功を収めている。
しかし、これらの手法はプライベートに合成されたデータセット上で訓練または評価されるため、その後のアプローチでそれと比較的比較することは不可能である。
この問題を解決するために、まず、EDFace-Celeb-1M (BFR128) とEDFace-Celeb-150K (BFR512) と呼ばれる2つのブラインドフェイス復元ベンチマークデータセットを合成する。
最先端の手法は、ブラー、ノイズ、低解像度、JPEG圧縮アーティファクト、それらの組み合わせ(完全な劣化)の5つの設定でベンチマークされる。
比較をより包括的にするために、広く使われている5つのメトリクスと、平均顔ランドマーク距離(AFLD)と平均顔IDコサイン類似度(AFICS)を含む2つのタスク駆動メトリクスを適用した。
さらに,Swin Transformer U-Net (STUNet) と呼ばれる効率的なベースラインモデルを開発した。
U-netアーキテクチャを備えたSTUNetは、注目機構とシフトウインドウ方式を適用して、長距離ピクセル間相互作用をキャプチャし、効率よくトレーニングしながら重要な特徴に集中する。
実験の結果,提案手法は様々なBFRタスクにおいてSOTA法に対して好適に動作することがわかった。
関連論文リスト
- Bridging the Gaps: Utilizing Unlabeled Face Recognition Datasets to Boost Semi-Supervised Facial Expression Recognition [5.750927184237346]
我々は、半教師付きFERを高めるために、大きな未ラベルの顔認識(FR)データセットを活用することに重点を置いている。
具体的には,アノテーションを使わずに大規模な顔画像の事前訓練を行う。
ラベル付き画像や多彩な画像の不足を緩和するために、Mixupベースのデータ拡張戦略を提案する。
論文 参考訳(メタデータ) (2024-10-23T07:26:19Z) - Analysis and Benchmarking of Extending Blind Face Image Restoration to Videos [99.42805906884499]
まず,実世界の低品質顔画像ベンチマーク(RFV-LQ)を導入し,画像に基づく顔復元アルゴリズムの評価を行った。
次に、失明顔画像復元アルゴリズムを劣化顔ビデオに拡張する際の利点と課題を網羅的に分析する。
分析では、主に顔成分の顕著なジッタとフレーム間のノイズシェープの2つの側面に分類する。
論文 参考訳(メタデータ) (2024-10-15T17:53:25Z) - A Simple and Generalist Approach for Panoptic Segmentation [57.94892855772925]
汎用的なビジョンモデルは、様々なビジョンタスクのための1つの同じアーキテクチャを目指している。
このような共有アーキテクチャは魅力的に思えるかもしれないが、ジェネラリストモデルは、その好奇心に満ちたモデルよりも優れている傾向にある。
一般モデルの望ましい性質を損なうことなく、2つの重要なコントリビューションを導入することでこの問題に対処する。
論文 参考訳(メタデータ) (2024-08-29T13:02:12Z) - A visualization method for data domain changes in CNN networks and the optimization method for selecting thresholds in classification tasks [1.1118946307353794]
Face Anti-Spoofing (FAS) は、顔認識技術のセキュリティを維持する上で重要な役割を担っている。
偽造顔生成技術の台頭に伴い、デジタル編集された顔が反偽造に直面する課題がエスカレートしている。
本稿では,データセット上での予測結果を可視化することにより,モデルのトレーニング結果を直感的に反映する可視化手法を提案する。
論文 参考訳(メタデータ) (2024-04-19T03:12:17Z) - Latent Diffusion Models for Attribute-Preserving Image Anonymization [4.080920304681247]
本稿では,遅延拡散モデル(LDM)に基づく画像匿名化への最初のアプローチを提案する。
CAFLaGE-Baseは、事前訓練された制御ネットと、実画像と匿名画像との距離を増やすために設計された新しい制御機構を組み合わせた2つのLCMを提案する。
論文 参考訳(メタデータ) (2024-03-21T19:09:21Z) - UniTSFace: Unified Threshold Integrated Sample-to-Sample Loss for Face
Recognition [35.66000285310775]
サンプル・サンプル・サンプル・ベース・ロス(USS損失)の統合しきい値を提案する。
USS損失は、正の対と負の対を区別するための明確な統一されたしきい値である。
また,サンプル対サンプルベースのソフトマックスとBCE損失を導出し,それらの関係について考察した。
論文 参考訳(メタデータ) (2023-11-04T23:00:40Z) - Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。
私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。
提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2023-08-01T03:44:56Z) - Multi-Prior Learning via Neural Architecture Search for Blind Face
Restoration [61.27907052910136]
Blind Face Restoration (BFR)は、高品質な顔画像から高品質な顔画像を復元することを目的としている。
1)手動チューニングを伴わない強力なネットワークアーキテクチャの導出方法,2) 複数の顔前者からの補完情報を1つのネットワークで取得して復元性能を向上させる方法,の2つの大きな課題がある。
特定検索空間内において,適切な特徴抽出アーキテクチャを適応的に探索する顔復元検索ネットワーク(FRSNet)を提案する。
論文 参考訳(メタデータ) (2022-06-28T12:29:53Z) - Unsupervised Learning Facial Parameter Regressor for Action Unit
Intensity Estimation via Differentiable Renderer [51.926868759681014]
骨駆動型顔モデル(BDFM)に基づいて,異なる視点で顔パラメータを予測する枠組みを提案する。
提案するフレームワークは,特徴抽出器,ジェネレータ,顔パラメータ回帰器から構成される。
論文 参考訳(メタデータ) (2020-08-20T09:49:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。