論文の概要: SMFD-UNet: Semantic Face Mask Is The Only Thing You Need To Deblur Faces
- arxiv url: http://arxiv.org/abs/2604.07477v1
- Date: Wed, 08 Apr 2026 18:16:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.501564
- Title: SMFD-UNet: Semantic Face Mask Is The Only Thing You Need To Deblur Faces
- Title(参考訳): SMFD-UNet:Semantic Face Maskは、顔を損なうための唯一の方法
- Authors: Abduz Zami,
- Abstract要約: SMFD-UNet(Semantic Mask Fusion Deblurring UNet)を提案する。
SMFD-UNetは,高ピーク信号雑音比 (PSNR) と構造類似度指数測定 (SSIM) を達成しつつ, 良好な自然度対策を保ちながら, 最先端モデルよりも優れた性能を示すことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For applications including facial identification, forensic analysis, photographic improvement, and medical imaging diagnostics, facial image deblurring is an essential chore in computer vision allowing the restoration of high-quality images from blurry inputs. Often based on general picture priors, traditional deblurring techniques find it difficult to capture the particular structural and identity-specific features of human faces. We present SMFD-UNet (Semantic Mask Fusion Deblurring UNet), a new lightweight framework using semantic face masks to drive the deblurring process, therefore removing the need for high-quality reference photos in order to solve these difficulties. First, our dual-step method uses a UNet-based semantic mask generator to directly extract detailed facial component masks (e.g., eyes, nose, mouth) straight from blurry photos. Sharp, high-fidelity facial images are subsequently produced by integrating these masks with the blurry input using a multi-stage feature fusion technique within a computationally efficient UNet framework. We created a randomized blurring pipeline that roughly replicates real-world situations by simulating around 1.74 trillion deterioration scenarios, hence guaranteeing resilience. Examined on the CelebA dataset, SMFD-UNet shows better performance than state-of-the-art models, attaining higher Peak Signal-to-Noise Ratio (PSNR) and Structural Similarity Index Measure (SSIM) while preserving satisfactory naturalness measures, including NIQE, LPIPS, and FID. Powered by Residual Dense Convolution Blocks (RDC), a multi-stage feature fusion strategy, efficient and effective upsampling techniques, attention techniques like CBAM, post-processing techniques, and the lightweight design guarantees scalability and efficiency, enabling SMFD-UNet to be a flexible solution for developing facial image restoration research and useful applications.
- Abstract(参考訳): 顔の識別、法医学的分析、写真改善、医用画像診断などの応用において、顔画像の劣化は、ぼやけた入力から高品質な画像の復元を可能にするコンピュータビジョンにおいて不可欠である。
一般的な画像の先行に基づいて、従来のデブロアリング技術では、人間の顔の特定の構造的特徴やアイデンティティ固有の特徴を捉えることは困難である。
SMFD-UNet(Semantic Mask Fusion Deblurring UNet)は、セマンティックマスクを用いた新しい軽量なフレームワークである。
まず、UNetベースのセマンティックマスク生成装置を用いて、ぼやけた写真から直接、詳細な顔成分マスク(例えば、目、鼻、口)を直接抽出する。
シャープ、高忠実な顔画像は、計算効率のよいUNetフレームワーク内で多段特徴融合技術を用いて、これらのマスクをぼやけた入力と統合することによって生成される。
我々は、約1.74兆の劣化シナリオをシミュレートすることで、現実の状況を大まかに再現するランダム化されたぼやけたパイプラインを作成しました。
CelebAデータセットにおいて、SMFD-UNetは、NIQE、LPIPS、FIDなどの良好な自然度対策を保ちながら、より高いピーク信号雑音比(PSNR)と構造類似度指標(SSIM)を達成することによって、最先端モデルよりも優れたパフォーマンスを示す。
Residual Dense Convolution Blocks (RDC)によってパワーアップされたマルチステージ機能融合戦略、効率的で効果的なアップサンプリング技術、CBAMのような注目技術、後処理技術、軽量設計はスケーラビリティと効率性を保証する。
関連論文リスト
- A Dual-Branch CNN for Robust Detection of AI-Generated Facial Forgeries [4.313893060699182]
顔偽造技術は、AIセキュリティ、デジタルメディアの完全性、および公的な信頼に重大な脅威をもたらす。
顔偽造検出のための新しい二分岐畳み込みニューラルネットワークを提案する。
4つの代表法から生成された鍛造画像を含むDiFFベンチマークを用いて,本モデルの評価を行った。
論文 参考訳(メタデータ) (2025-10-28T17:06:40Z) - SGDFuse: SAM-Guided Diffusion for High-Fidelity Infrared and Visible Image Fusion [65.80051636480836]
本稿では,Segment Anything Model(SAM)によって導かれる条件拡散モデルを提案する。
このフレームワークは2段階のプロセスで動作し、まずマルチモーダルな特徴の予備的な融合を行い、その後、拡散モデルの粗大な分極生成を駆動する条件としてセマンティックマスクを利用する。
SGDFuseは主観的評価と客観的評価の両方において最先端の性能を発揮することを示す。
論文 参考訳(メタデータ) (2025-08-07T10:58:52Z) - OSDFace: One-Step Diffusion Model for Face Restoration [72.5045389847792]
拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-26T07:07:48Z) - DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.40724659748787]
DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文 参考訳(メタデータ) (2024-03-27T11:32:44Z) - SimFLE: Simple Facial Landmark Encoding for Self-Supervised Facial
Expression Recognition in the Wild [3.4798852684389963]
顔のランドマークの効果的な符号化を学習できる自己教師型簡易顔ランドマーク符号化法(SimFLE)を提案する。
この目的のために、新しいFaceMAEモジュールを紹介します。
いくつかのFER-Wベンチマークの実験結果から、提案したSimFLEは顔のランドマークのローカライゼーションに優れていることが証明された。
論文 参考訳(メタデータ) (2023-03-14T06:30:55Z) - GMFIM: A Generative Mask-guided Facial Image Manipulation Model for
Privacy Preservation [0.7734726150561088]
入力顔画像に知覚不可能な編集を適用するために,GANをベースとしたマスク誘導顔画像マニピュレーションモデルを提案する。
我々のモデルは、最先端の手法と比較して、自動顔認識システムに対してより良い性能を実現することができる。
論文 参考訳(メタデータ) (2022-01-10T14:09:14Z) - Network Architecture Search for Face Enhancement [82.25775020564654]
我々は、NASFE(Network Architecture Search for Face Enhancement)と呼ばれるマルチタスクの顔復元ネットワークを提案する。
NASFEは、単一の劣化(すなわち)を含む低品質の顔画像を高めることができる。
ノイズまたはぼやけ)または複数の劣化(ノイズ+ブラル+ローライト)
論文 参考訳(メタデータ) (2021-05-13T19:46:05Z) - JDSR-GAN: Constructing A Joint and Collaborative Learning Network for
Masked Face Super-Resolution [28.022800882214803]
ほとんどのビデオ監視シナリオで得られた顔画像は、マスクと同時に低解像度です。
これまでのスーパーレゾリューションソリューションのほとんどは、1つのモデルで両方のタスクを処理できない。
我々は,マスク付き顔超解像課題のための共同学習ネットワークJDSR-GANを構築した。
論文 参考訳(メタデータ) (2021-03-25T08:50:40Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。