論文の概要: Fast, faithful and photorealistic diffusion-based image super-resolution with enhanced Flow Map models
- arxiv url: http://arxiv.org/abs/2601.16660v1
- Date: Fri, 23 Jan 2026 11:25:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.659509
- Title: Fast, faithful and photorealistic diffusion-based image super-resolution with enhanced Flow Map models
- Title(参考訳): 拡張フローマップモデルを用いた高速・忠実・光現実的拡散に基づく超解像
- Authors: Maxence Noble, Gonzalo Iñaki Quintana, Benjamin Aubin, Clément Chadebec,
- Abstract要約: FlowMapSRは、効率的な推論のために明示的に設計された画像超解像のための新しい拡散ベースのフレームワークである。
FlowMapSRは、最近のx4およびx8アップスケーリングの最先端手法よりも、再構築忠実度とフォトリアリズムのバランスが良いことを示す。
- 参考スコア(独自算出の注目度): 8.773008452897791
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion-based image super-resolution (SR) has recently attracted significant attention by leveraging the expressive power of large pre-trained text-to-image diffusion models (DMs). A central practical challenge is resolving the trade-off between reconstruction faithfulness and photorealism. To address inference efficiency, many recent works have explored knowledge distillation strategies specifically tailored to SR, enabling one-step diffusion-based approaches. However, these teacher-student formulations are inherently constrained by information compression, which can degrade perceptual cues such as lifelike textures and depth of field, even with high overall perceptual quality. In parallel, self-distillation DMs, known as Flow Map models, have emerged as a promising alternative for image generation tasks, enabling fast inference while preserving the expressivity and training stability of standard DMs. Building on these developments, we propose FlowMapSR, a novel diffusion-based framework for image super-resolution explicitly designed for efficient inference. Beyond adapting Flow Map models to SR, we introduce two complementary enhancements: (i) positive-negative prompting guidance, based on a generalization of classifier free-guidance paradigm to Flow Map models, and (ii) adversarial fine-tuning using Low-Rank Adaptation (LoRA). Among the considered Flow Map formulations (Eulerian, Lagrangian, and Shortcut), we find that the Shortcut variant consistently achieves the best performance when combined with these enhancements. Extensive experiments show that FlowMapSR achieves a better balance between reconstruction faithfulness and photorealism than recent state-of-the-art methods for both x4 and x8 upscaling, while maintaining competitive inference time. Notably, a single model is used for both upscaling factors, without any scale-specific conditioning or degradation-guided mechanisms.
- Abstract(参考訳): 拡散に基づく画像超解像 (SR) は, 大規模なテキスト・画像拡散モデル (DM) の表現力を活用して注目されている。
中心的な実践的課題は、再構築の忠実さと光現実主義のトレードオフを解決することである。
推論効率に対処するため、近年の多くの研究は、SRに適した知識蒸留戦略を探求し、一段階の拡散に基づくアプローチを可能にした。
しかし、これらの教師の学生による定式化は、情報圧縮によって本質的に制約され、生活のようなテクスチャや被写界深度などの知覚的手がかりを、全体的な知覚的品質の高いものでも分解することができる。
並行して、フローマップモデルとして知られる自己蒸留DMが画像生成タスクの有望な代替として登場し、標準DMの表現性と訓練安定性を維持しながら高速な推論を可能にしている。
提案するFlowMapSRは,高効率な推論のために設計された画像の超高解像度化のための新しい拡散ベースフレームワークである。
SRへのフローマップモデルの適用以外にも、2つの補完的な拡張を紹介します。
(i)フローマップモデルへの分類自由誘導パラダイムの一般化に基づく正負のプロンプトガイダンス
(II)ローランド適応(LoRA)を用いた逆向き微調整
検討されたフローマップの定式化(Eulerian、Lagrangian、Shortcut)のうち、ショートカットの変種は、これらの拡張と組み合わせることで、一貫して最高のパフォーマンスを実現している。
大規模な実験により、FlowMapSRは、競合的推論時間を維持しながら、最近のx4とx8のアップスケーリングの最先端手法よりも、再構築忠実性とフォトリアリズムのバランスが良いことが示されている。
特に、スケール固有の条件付けや劣化誘導機構を使わずに、アップスケーリング要因の両方に単一のモデルが使用される。
関連論文リスト
- GuideSR: Rethinking Guidance for One-Step High-Fidelity Diffusion-Based Super-Resolution [15.563111624900865]
GuideSRは、画像の忠実度を高めるために特別に設計された、単一ステップ拡散に基づく画像超解像(SR)モデルである。
提案手法は,PSNR, SSIM, LPIPS, DISTS, FIDなど,様々な基準ベースの指標において,既存の手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2025-05-01T17:48:25Z) - Consistency Trajectory Matching for One-Step Generative Super-Resolution [27.414903007958657]
現在の拡散に基づく超解像法は、高い推論オーバーヘッドを犠牲にして可換性を実現する。
超解法のための一貫性トラジェクトリマッチング (CTMSR) を提案する。これは蒸留不要戦略であり、フォトリアリスティックSRを1ステップで生成できる。
提案手法は, 合成データセットと実データセットの両方において, 同等あるいはそれ以上の能力が得られることを示す。
論文 参考訳(メタデータ) (2025-03-26T09:20:42Z) - One Diffusion Step to Real-World Super-Resolution via Flow Trajectory Distillation [60.54811860967658]
FluxSRはフローマッチングモデルに基づく新しい一段階拡散リアルISRである。
まず,フロートラジェクトリ蒸留(FTD)を導入し,多段階のフローマッチングモデルを1段階のリアルISRに蒸留する。
第2に、画像リアリズムを改善し、生成画像の高周波アーティファクト問題に対処するために、テレビLPIPSを知覚的損失として提案する。
論文 参考訳(メタデータ) (2025-02-04T04:11:29Z) - FaithDiff: Unleashing Diffusion Priors for Faithful Image Super-resolution [48.88184541515326]
本稿では,忠実な画像SRのための遅延拡散モデル(LDM)のパワーをフル活用するために,FithDiffというシンプルで効果的な手法を提案する。
高品質画像上で事前学習した拡散モデルを凍結する既存の拡散ベースSR法とは対照的に,有用な情報を特定し,忠実な構造を復元する前に拡散を解き放つことを提案する。
論文 参考訳(メタデータ) (2024-11-27T23:58:03Z) - Timestep-Aware Diffusion Model for Extreme Image Rescaling [47.89362819768323]
本稿では,時間認識拡散モデル(TADM)と呼ばれる,画像再スケーリングのための新しいフレームワークを提案する。
TADMは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を行う。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文 参考訳(メタデータ) (2024-08-17T09:51:42Z) - FlowIE: Efficient Image Enhancement via Rectified Flow [71.6345505427213]
FlowIEはフローベースのフレームワークであり、基本的な分布から高品質な画像への直線パスを推定する。
私たちのコントリビューションは、合成および実世界のデータセットに関する包括的な実験を通じて、厳密に検証されています。
論文 参考訳(メタデータ) (2024-06-01T17:29:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。