論文の概要: Face2Scene: Using Facial Degradation as an Oracle for Diffusion-Based Scene Restoration
- arxiv url: http://arxiv.org/abs/2603.16570v1
- Date: Tue, 17 Mar 2026 14:27:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.333991
- Title: Face2Scene: Using Facial Degradation as an Oracle for Diffusion-Based Scene Restoration
- Title(参考訳): Face2Scene: 拡散に基づくシーン復元のためのOracleとして顔の劣化を利用する
- Authors: Amirhossein Kazerouni, Maitreya Suin, Tristan Aumentado-Armstrong, Sina Honari, Amanpreet Walia, Iqbal Mohomed, Konstantinos G. Derpanis, Babak Taati, Alex Levinshtein,
- Abstract要約: Face2Sceneは2段階の修復フレームワークで、顔が知覚の託宣として活用され、画像全体の劣化を推定し、復元を導く。
実験により,提案手法の有効性を最先端手法と比較した。
- 参考スコア(独自算出の注目度): 22.308112548367728
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in image restoration have enabled high-fidelity recovery of faces from degraded inputs using reference-based face restoration models (Ref-FR). However, such methods focus solely on facial regions, neglecting degradation across the full scene, including body and background, which limits practical usability. Meanwhile, full-scene restorers often ignore degradation cues entirely, leading to underdetermined predictions and visual artifacts. In this work, we propose Face2Scene, a two-stage restoration framework that leverages the face as a perceptual oracle to estimate degradation and guide the restoration of the entire image. Given a degraded image and one or more identity references, we first apply a Ref-FR model to reconstruct high-quality facial details. From the restored-degraded face pair, we extract a face-derived degradation code that captures degradation attributes (e.g., noise, blur, compression), which is then transformed into multi-scale degradation-aware tokens. These tokens condition a diffusion model to restore the full scene in a single step, including the body and background. Extensive experiments demonstrate the superior effectiveness of the proposed method compared to state-of-the-art methods.
- Abstract(参考訳): 画像復元の最近の進歩は、参照ベースの顔復元モデル(Ref-FR)を用いて、劣化した入力から顔の高忠実性回復を可能にした。
しかし、このような手法は顔領域のみに焦点をあて、身体や背景を含む全身の劣化を無視し、実用的使用性を制限している。
一方、フルシーンの復元者は劣化の手がかりを完全に無視することが多く、未決定の予測や視覚的アーティファクトに繋がる。
本研究では,顔を知覚の託宣として活用し,画像全体の劣化を推定し,復元を導く2段階の修復フレームワークであるFace2Sceneを提案する。
劣化画像と1つ以上のアイデンティティ参照が与えられた場合、まずRef-FRモデルを用いて高品質な顔の詳細を再構成する。
復元された顔対から、劣化特性(例えば、ノイズ、ぼかし、圧縮)を捉えた顔由来の劣化コードを抽出し、それをマルチスケールの劣化認識トークンに変換する。
これらのトークンは、ボディとバックグラウンドを含む単一のステップでフルシーンを復元する拡散モデルを条件付けている。
大規模実験により, 提案手法の最先端手法と比較して, 優れた有効性を示した。
関連論文リスト
- Invert2Restore: Zero-Shot Degradation-Blind Image Restoration [19.263005158979567]
Invert2Restoreはゼロショットでトレーニング不要なメソッドで、完全に盲目と部分的に盲目の両方で動作する。
様々な種類の画像劣化をうまく一般化する。
Invert2Restoreは複数の画像復元タスクに対して実験的に検証する。
論文 参考訳(メタデータ) (2025-03-27T13:22:40Z) - AuthFace: Towards Authentic Blind Face Restoration with Face-oriented Generative Diffusion Prior [13.27748226506837]
ブラインドフェイス修復(BFR)は、コンピュータビジョンにおける基本的な問題である。
最近の研究は、強力な事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルによる顔画像の先行性に依存している。
本稿では,顔指向生成拡散を先行して探索することにより,顔復元の精度を高めるAuthFaceを提案する。
論文 参考訳(メタデータ) (2024-10-13T14:56:13Z) - Overcoming False Illusions in Real-World Face Restoration with Multi-Modal Guided Diffusion Model [55.46927355649013]
本稿では,新しいマルチモーダル・リアル・ワールド・フェイス・リカバリ技術を紹介する。
MGFRは偽の顔の特徴とアイデンティティの生成を緩和することができる。
4800のアイデンティティにまたがる21,000以上の高解像度顔画像からなるReface-HQデータセットを提案する。
論文 参考訳(メタデータ) (2024-10-05T13:46:56Z) - Diff-Restorer: Unleashing Visual Prompts for Diffusion-based Universal Image Restoration [19.87693298262894]
拡散モデルに基づく普遍的な画像復元手法であるDiff-Restorerを提案する。
我々は、事前学習された視覚言語モデルを用いて、劣化した画像から視覚的プロンプトを抽出する。
また、デグレーション対応デコーダを設計し、構造的補正を行い、潜在コードをピクセル領域に変換する。
論文 参考訳(メタデータ) (2024-07-04T05:01:10Z) - DR2: Diffusion-based Robust Degradation Remover for Blind Face
Restoration [66.01846902242355]
ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。
トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。
本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
論文 参考訳(メタデータ) (2023-03-13T06:05:18Z) - Implicit Subspace Prior Learning for Dual-Blind Face Restoration [66.67059961379923]
新しい暗黙的サブスペース事前学習(ISPL)フレームワークが、二重盲顔復元の一般的な解決策として提案されている。
実験の結果,既存の最先端手法に対するISPLの認識歪改善が顕著であった。
論文 参考訳(メタデータ) (2020-10-12T08:04:24Z) - HiFaceGAN: Face Renovation via Collaborative Suppression and
Replenishment [63.333407973913374]
フェース・リノベーション(FR)は意味誘導型生成問題である。
HiFaceGANは、複数のネストされたCSRユニットを含む多段階フレームワークである。
合成画像と実顔画像の両方の実験により,HiFaceGANの優れた性能が確認された。
論文 参考訳(メタデータ) (2020-05-11T11:33:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。