論文の概要: HeadsUp! High-Fidelity Portrait Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2510.09924v1
- Date: Fri, 10 Oct 2025 23:48:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.695233
- Title: HeadsUp! High-Fidelity Portrait Image Super-Resolution
- Title(参考訳): 高精細ポートレート画像の超解像
- Authors: Renjie Li, Zihao Zhu, Xiaoyu Wang, Zhengzhong Tu,
- Abstract要約: ポートレートISR (PortraitISR) 問題について検討し, 単一ステップ拡散モデルである HeadsUp を提案する。
具体的には, 単段階拡散モデル上にモデルを構築し, 顔監視機構を開発する。
次に、参照ベースのメカニズムを統合してアイデンティティの復元を支援し、低品質の顔復元における顔のあいまいさを低減する。
- 参考スコア(独自算出の注目度): 25.264194345148365
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Portrait pictures, which typically feature both human subjects and natural backgrounds, are one of the most prevalent forms of photography on social media. Existing image super-resolution (ISR) techniques generally focus either on generic real-world images or strictly aligned facial images (i.e., face super-resolution). In practice, separate models are blended to handle portrait photos: the face specialist model handles the face region, and the general model processes the rest. However, these blending approaches inevitably introduce blending or boundary artifacts around the facial regions due to different model training recipes, while human perception is particularly sensitive to facial fidelity. To overcome these limitations, we study the portrait image supersolution (PortraitISR) problem, and propose HeadsUp, a single-step diffusion model that is capable of seamlessly restoring and upscaling portrait images in an end-to-end manner. Specifically, we build our model on top of a single-step diffusion model and develop a face supervision mechanism to guide the model in focusing on the facial region. We then integrate a reference-based mechanism to help with identity restoration, reducing face ambiguity in low-quality face restoration. Additionally, we have built a high-quality 4K portrait image ISR dataset dubbed PortraitSR-4K, to support model training and benchmarking for portrait images. Extensive experiments show that HeadsUp achieves state-of-the-art performance on the PortraitISR task while maintaining comparable or higher performance on both general image and aligned face datasets.
- Abstract(参考訳): ポートレート写真は通常、人間の主題と自然の背景の両方を特徴としているが、ソーシャルメディア上でもっとも一般的な写真形式の一つである。
既存の画像超解像(ISR)技術は一般的に、一般的な現実世界の画像や厳密に整列された顔画像(顔超解像)に焦点を当てている。
顔スペシャリストモデルは顔領域を扱い、一般的なモデルは残りの部分を処理します。
しかしながら、これらのブレンディングアプローチは、異なるモデルトレーニングレシピによる顔面領域の周囲のブレンディングや境界アーティファクトを必然的に導入する一方で、人間の知覚は特に顔の忠実さに敏感である。
これらの制約を克服するために,ポートレート画像の超解法(PortraitISR)問題について検討し,画像のシームレスな復元とアップスケールが可能な単一ステップ拡散モデルであるHeadsUpを提案する。
具体的には, 単段階拡散モデル上にモデルを構築し, 顔領域に焦点を絞ったモデル案内のための顔監視機構を開発する。
次に、参照ベースのメカニズムを統合してアイデンティティの復元を支援し、低品質の顔復元における顔のあいまいさを低減する。
さらに、ポートレートSR-4Kと呼ばれる高品質な4Kポートレート画像ISRデータセットを構築し、ポートレート画像のモデルトレーニングとベンチマークをサポートする。
大規模な実験により、HeadsUpはPortraitISRタスクで最先端のパフォーマンスを達成し、一般的な画像と整列した顔データセットの両方で同等または高いパフォーマンスを維持していることがわかった。
関連論文リスト
- Towards Consistent and Controllable Image Synthesis for Face Editing [18.646961062736207]
RigFaceは、ポートレート写真のライティング、表情、ヘッドポーズを制御する新しいアプローチである。
我々のモデルは、既存の顔編集モデルと比較して、アイデンティティ保存とフォトリアリズムの両方において同等またはそれ以上の性能を達成している。
論文 参考訳(メタデータ) (2025-02-04T16:36:07Z) - AuthFace: Towards Authentic Blind Face Restoration with Face-oriented Generative Diffusion Prior [13.27748226506837]
ブラインドフェイス修復(BFR)は、コンピュータビジョンにおける基本的な問題である。
最近の研究は、強力な事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルによる顔画像の先行性に依存している。
本稿では,顔指向生成拡散を先行して探索することにより,顔復元の精度を高めるAuthFaceを提案する。
論文 参考訳(メタデータ) (2024-10-13T14:56:13Z) - Single Image, Any Face: Generalisable 3D Face Generation [59.9369171926757]
我々は,制約のない単一画像入力を伴う3次元顔を生成する新しいモデルGen3D-Faceを提案する。
私たちの知る限りでは、これは1枚の画像からフォトリアリスティックな3D顔アバターを作るための最初の試みであり、ベンチマークである。
論文 参考訳(メタデータ) (2024-09-25T14:56:37Z) - EFHQ: Multi-purpose ExtremePose-Face-HQ dataset [1.8194090162317431]
この研究は、Extreme Pose Face High-Qualityデータセット(EFHQ)と呼ばれる新しいデータセットを導入し、極端なポーズで顔の最大450kの高品質な画像を含む。
このような膨大なデータセットを生成するために、我々は、新しく精巧なデータセット処理パイプラインを使用して、2つの公開データセットをキュレートする。
我々のデータセットは、顔合成と2D/3D対応のGAN、拡散ベースの顔生成、顔の再現など、さまざまな顔関連タスクに関する既存のデータセットを補完することができる。
論文 参考訳(メタデータ) (2023-12-28T18:40:31Z) - Pro-UIGAN: Progressive Face Hallucination from Occluded Thumbnails [53.080403912727604]
Inpainting Generative Adversarial Network, Pro-UIGANを提案する。
顔の形状を利用して、隠された小さな顔の補充とアップサンプリング(8*)を行う。
Pro-UIGANは、HR面を視覚的に満足させ、下流タスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-08-02T02:29:24Z) - Learning to Aggregate and Personalize 3D Face from In-the-Wild Photo
Collection [65.92058628082322]
非パラメトリックフェースモデリングは形状仮定なしで画像からのみ3次元フェースを再構成することを目的としている。
本稿では,教師なしのロバストな3次元顔モデリングのための学習・アグリゲート・パーソナライズ・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T03:10:17Z) - Joint Face Image Restoration and Frontalization for Recognition [79.78729632975744]
現実世界のシナリオでは、大きなポーズ、悪い照明、低解像度、ぼやけ、ノイズなど、多くの要因が顔認識性能を損なう可能性がある。
それまでの努力は通常、まず品質の低い顔から高品質な顔に復元し、次に顔認識を行う。
与えられた低品質の顔からフロンダル化された高品質の顔を復元する多段階顔復元モデルを提案する。
論文 参考訳(メタデータ) (2021-05-12T03:52:41Z) - Face Hallucination with Finishing Touches [65.14864257585835]
本稿では,超解像とフロンティア化を同時に行うVivid Face Hallucination Generative Adversarial Network (VividGAN)を提案する。
VividGANは粗いレベルと細かなレベルのFace Hallucination Networks (FHnet)と、粗いDとファインDの2つの識別器で構成されている。
実験により、VvidGANは、フォトリアリスティックな正面HR面を達成し、下流タスクにおいて優れた性能を達成できることが示された。
論文 参考訳(メタデータ) (2020-02-09T07:33:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。