Fugu-MT 論文翻訳(概要): Blind Face Restoration: Benchmark Datasets and a Baseline Model

論文の概要: Blind Face Restoration: Benchmark Datasets and a Baseline Model

arxiv url: http://arxiv.org/abs/2206.03697v1
Date: Wed, 8 Jun 2022 06:34:24 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-09 13:55:12.090524
Title: Blind Face Restoration: Benchmark Datasets and a Baseline Model
Title（参考訳）: blind face restoration:ベンチマークデータセットとベースラインモデル
Authors: Puyang Zhang, Kaihao Zhang, Wenhan Luo, Changsheng Li, Guoren Wang
Abstract要約: Blind Face Restoration (BFR) は、対応する低品質 (LQ) 入力から高品質 (HQ) の顔画像を構築することを目的としている。 EDFace-Celeb-1M (BFR128) と EDFace-Celeb-150K (BFR512) と呼ばれる2つのブラインドフェイス復元ベンチマークデータセットを最初に合成する。最先端の手法は、ブラー、ノイズ、低解像度、JPEG圧縮アーティファクト、それらの組み合わせ(完全な劣化)の5つの設定でベンチマークされる。
参考スコア（独自算出の注目度）: 63.053331687284064
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Blind Face Restoration (BFR) aims to construct a high-quality (HQ) face image from its corresponding low-quality (LQ) input. Recently, many BFR methods have been proposed and they have achieved remarkable success. However, these methods are trained or evaluated on privately synthesized datasets, which makes it infeasible for the subsequent approaches to fairly compare with them. To address this problem, we first synthesize two blind face restoration benchmark datasets called EDFace-Celeb-1M (BFR128) and EDFace-Celeb-150K (BFR512). State-of-the-art methods are benchmarked on them under five settings including blur, noise, low resolution, JPEG compression artifacts, and the combination of them (full degradation). To make the comparison more comprehensive, five widely-used quantitative metrics and two task-driven metrics including Average Face Landmark Distance (AFLD) and Average Face ID Cosine Similarity (AFICS) are applied. Furthermore, we develop an effective baseline model called Swin Transformer U-Net (STUNet). The STUNet with U-net architecture applies an attention mechanism and a shifted windowing scheme to capture long-range pixel interactions and focus more on significant features while still being trained efficiently. Experimental results show that the proposed baseline method performs favourably against the SOTA methods on various BFR tasks.
Abstract（参考訳）: Blind Face Restoration (BFR)は、対応する低品質(LQ)入力から高品質(HQ)フェイスイメージを構築することを目的としている。近年,多くのBFR法が提案され,大きな成功を収めている。しかし、これらの手法はプライベートに合成されたデータセット上で訓練または評価されるため、その後のアプローチでそれと比較的比較することは不可能である。この問題を解決するために、まず、EDFace-Celeb-1M (BFR128) とEDFace-Celeb-150K (BFR512) と呼ばれる2つのブラインドフェイス復元ベンチマークデータセットを合成する。最先端の手法は、ブラー、ノイズ、低解像度、JPEG圧縮アーティファクト、それらの組み合わせ(完全な劣化)の5つの設定でベンチマークされる。比較をより包括的にするために、広く使われている5つのメトリクスと、平均顔ランドマーク距離(AFLD)と平均顔IDコサイン類似度(AFICS)を含む2つのタスク駆動メトリクスを適用した。さらに,Swin Transformer U-Net (STUNet) と呼ばれる効率的なベースラインモデルを開発した。 U-netアーキテクチャを備えたSTUNetは、注目機構とシフトウインドウ方式を適用して、長距離ピクセル間相互作用をキャプチャし、効率よくトレーニングしながら重要な特徴に集中する。実験の結果,提案手法は様々なBFRタスクにおいてSOTA法に対して好適に動作することがわかった。

関連論文リスト

xEdgeFace: Efficient Cross-Spectral Face Recognition for Edge Devices [4.910937238451485]
Heterogeneous Face Recognition (HFR) は、異なる知覚モードにわたる顔画像のマッチングという課題に対処する。ハイブリッドCNN-Transformerアーキテクチャを適用し,軽量かつ効果的なHFRフレームワークを提案する。提案手法は,RGBの顔認識タスクにおいて高い性能を保ちながら,最小対の異種データを用いた効率的なエンドツーエンドトレーニングを実現する。
論文参考訳（メタデータ） (2025-04-28T10:03:11Z)
LVFace: Progressive Cluster Optimization for Large Vision Models in Face Recognition [9.067342817048253]
視覚変換器(ViT)は大規模な視覚モデリングに革命をもたらしたが、依然としてCNNが支配的である顔認識(FR)では未探索のままである。より優れた結果を得るために,プログレッシブクラスタ最適化(PCO)を統合したVTベースのFRモデルであるLVFaceを提案する。
論文参考訳（メタデータ） (2025-01-23T06:48:48Z)
Bridging the Gaps: Utilizing Unlabeled Face Recognition Datasets to Boost Semi-Supervised Facial Expression Recognition [5.750927184237346]
我々は、半教師付きFERを高めるために、大きな未ラベルの顔認識(FR)データセットを活用することに重点を置いている。具体的には,アノテーションを使わずに大規模な顔画像の事前訓練を行う。ラベル付き画像や多彩な画像の不足を緩和するために、Mixupベースのデータ拡張戦略を提案する。
論文参考訳（メタデータ） (2024-10-23T07:26:19Z)
Analysis and Benchmarking of Extending Blind Face Image Restoration to Videos [99.42805906884499]
まず,実世界の低品質顔画像ベンチマーク(RFV-LQ)を導入し,画像に基づく顔復元アルゴリズムの評価を行った。次に、失明顔画像復元アルゴリズムを劣化顔ビデオに拡張する際の利点と課題を網羅的に分析する。分析では、主に顔成分の顕著なジッタとフレーム間のノイズシェープの2つの側面に分類する。
論文参考訳（メタデータ） (2024-10-15T17:53:25Z)
A Simple and Generalist Approach for Panoptic Segmentation [57.94892855772925]
汎用的なビジョンモデルは、様々なビジョンタスクのための1つの同じアーキテクチャを目指している。このような共有アーキテクチャは魅力的に思えるかもしれないが、ジェネラリストモデルは、その好奇心に満ちたモデルよりも優れている傾向にある。一般モデルの望ましい性質を損なうことなく、2つの重要なコントリビューションを導入することでこの問題に対処する。
論文参考訳（メタデータ） (2024-08-29T13:02:12Z)
A visualization method for data domain changes in CNN networks and the optimization method for selecting thresholds in classification tasks [1.1118946307353794]
Face Anti-Spoofing (FAS) は、顔認識技術のセキュリティを維持する上で重要な役割を担っている。偽造顔生成技術の台頭に伴い、デジタル編集された顔が反偽造に直面する課題がエスカレートしている。本稿では,データセット上での予測結果を可視化することにより,モデルのトレーニング結果を直感的に反映する可視化手法を提案する。
論文参考訳（メタデータ） (2024-04-19T03:12:17Z)
Latent Diffusion Models for Attribute-Preserving Image Anonymization [4.080920304681247]
本稿では,遅延拡散モデル(LDM)に基づく画像匿名化への最初のアプローチを提案する。 CAFLaGE-Baseは、事前訓練された制御ネットと、実画像と匿名画像との距離を増やすために設計された新しい制御機構を組み合わせた2つのLCMを提案する。
論文参考訳（メタデータ） (2024-03-21T19:09:21Z)
UniTSFace: Unified Threshold Integrated Sample-to-Sample Loss for Face Recognition [35.66000285310775]
サンプル・サンプル・サンプル・ベース・ロス(USS損失)の統合しきい値を提案する。 USS損失は、正の対と負の対を区別するための明確な統一されたしきい値である。また,サンプル対サンプルベースのソフトマックスとBCE損失を導出し,それらの関係について考察した。
論文参考訳（メタデータ） (2023-11-04T23:00:40Z)
Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文参考訳（メタデータ） (2023-08-01T03:44:56Z)
Sample Less, Learn More: Efficient Action Recognition via Frame Feature Restoration [59.6021678234829]
本稿では,2つのスパースサンプリングおよび隣接するビデオフレームの中間特徴を復元する新しい手法を提案する。提案手法の統合により, 一般的な3つのベースラインの効率は50%以上向上し, 認識精度は0.5%低下した。
論文参考訳（メタデータ） (2023-07-27T13:52:42Z)
Multi-Prior Learning via Neural Architecture Search for Blind Face Restoration [61.27907052910136]
Blind Face Restoration (BFR)は、高品質な顔画像から高品質な顔画像を復元することを目的としている。 1)手動チューニングを伴わない強力なネットワークアーキテクチャの導出方法,2) 複数の顔前者からの補完情報を1つのネットワークで取得して復元性能を向上させる方法,の2つの大きな課題がある。特定検索空間内において,適切な特徴抽出アーキテクチャを適応的に探索する顔復元検索ネットワーク(FRSNet)を提案する。
論文参考訳（メタデータ） (2022-06-28T12:29:53Z)
Unsupervised Learning Facial Parameter Regressor for Action Unit Intensity Estimation via Differentiable Renderer [51.926868759681014]
骨駆動型顔モデル(BDFM)に基づいて,異なる視点で顔パラメータを予測する枠組みを提案する。提案するフレームワークは,特徴抽出器,ジェネレータ,顔パラメータ回帰器から構成される。
論文参考訳（メタデータ） (2020-08-20T09:49:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。