論文の概要: Noise-Started One-Step Real-World Super-Resolution via LR-Conditioned SplitMeanFlow and GAN Refinement
- arxiv url: http://arxiv.org/abs/2605.09328v1
- Date: Sun, 10 May 2026 05:01:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.193666
- Title: Noise-Started One-Step Real-World Super-Resolution via LR-Conditioned SplitMeanFlow and GAN Refinement
- Title(参考訳): LR-conditioned SplitMean FlowとGANリファインメントによる一段階実世界の超解像
- Authors: Wei Zhu, Kai Zhang, Yu Zheng, Lei Luo, Yong Guo, Jian Yang,
- Abstract要約: 本稿では、LR条件の SplitMeanFlow と GAN の改良によるノイズスタート1ステップの Real-ISR フレームワークを提案する。
SMFSRは1ステップ拡散に基づくReal-ISR法において、高速な単一ステップ推論を維持しながら最先端の品質を実現する。
- 参考スコア(独自算出の注目度): 32.05719533625606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pre-trained text-to-image (T2I) diffusion models have shown strong potential for real-world image super-resolution (Real-ISR), owing to their noise-started generation process that enables realistic texture synthesis and captures the one-to-many nature of super-resolution. However, diffusion-based Real-ISR methods still face a fundamental efficiency-quality trade-off. Multi-step methods generate high-quality results by iteratively denoising random Gaussian noise under LR conditioning, but suffer from slow sampling. Recent one-step methods greatly improve efficiency, yet they typically replace noise-started generation with direct LR-to-HR restoration, which weakens stochasticity and limits realistic detail synthesis. To address this issue, we propose SMFSR, a noise-started one-step Real-ISR framework via LR-conditioned SplitMeanFlow and GAN refinement. SMFSR preserves the random-noise starting point of diffusion models and learns a direct noise-to-HR mapping conditioned on the LR image. To this end, Interval Splitting Consistency distills the multi-step generative trajectory into a single average-velocity prediction, enabling efficient one-step generation. To compensate for the reduced opportunity for progressive refinement, we further introduce a GAN refinement stage, where a DINOv3-based discriminator enhances realistic texture synthesis and variational score distillation aligns the generated outputs with the natural image distribution under a frozen diffusion teacher. Extensive experiments demonstrate that SMFSR achieves state-of-the-art perceptual quality among one-step diffusion-based Real-ISR methods while retaining fast single-step inference.
- Abstract(参考訳): 事前学習されたテキスト・ツー・イメージ(T2I)拡散モデルは、現実的なテクスチャ合成を可能にし、超解像の1対多の性質を捉えたノイズスタート生成プロセスにより、現実世界の超解像(Real-ISR)に強い可能性を示している。
しかし、拡散に基づくReal-ISR法は依然として基本的な効率品質のトレードオフに直面している。
多段法はLR条件下でランダムガウス雑音を反復的にデノベートすることで高品質な結果を生成するが、サンプリングの遅さに悩まされる。
最近の一段階法は効率を大幅に改善するが、通常、ノイズスタートした世代をLR-to-HRの直接復元に置き換え、確率性を弱め、現実的な詳細合成を制限している。
この問題に対処するために,LR条件の SplitMeanFlow と GAN によるノイズスタート1ステップの Real-ISR フレームワーク SMFSR を提案する。
SMFSRは拡散モデルのランダムノイズ開始点を保存し、LR画像に条件付き直接ノイズ対HRマッピングを学習する。
この目的のために、インターバル分割一貫性は、多段階生成軌道を単一の平均速度予測に蒸留し、効率的なワンステップ生成を可能にする。
DINOv3をベースとした識別器が現実的なテクスチャ合成を強化し、変動スコアの蒸留により生成した出力を凍結拡散教師の下で自然な画像分布に整合させる。
SMFSRは1ステップ拡散に基づくReal-ISR法において、高速な単一ステップ推論を維持しながら、最先端の知覚品質を達成することを示した。
関連論文リスト
- LPNSR: Prior-Enhanced Diffusion Image Super-Resolution via LR-Guided Noise Prediction [4.609499769793957]
拡散に基づく画像超解像(SR)は、高分解能(HR)画像を対応する低分解能(LR)観測から再構成することを目的としている。
4段階の推論を効率よく行うと, 小型サンプリング軌道の劣化特性が著しく低下する。
これらの問題に対処するために,先進的な効率的な拡散フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-22T03:52:38Z) - Bidirectional Reward-Guided Diffusion for Real-World Image Super-Resolution [79.35296000454694]
拡散に基づく超解像は、豊富な詳細を合成することができるが、合成ペアデータで訓練されたモデルは、現実世界のLR画像では失敗することが多い。
我々は,超解像を軌道レベルの優先最適化として定式化する報奨誘導拡散フレームワークであるBird-SRを提案する。
実世界のSRベンチマークの実験では、Bird-SRは知覚品質において最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-05T19:21:45Z) - One Diffusion Step to Real-World Super-Resolution via Flow Trajectory Distillation [60.54811860967658]
FluxSRはフローマッチングモデルに基づく新しい一段階拡散リアルISRである。
まず,フロートラジェクトリ蒸留(FTD)を導入し,多段階のフローマッチングモデルを1段階のリアルISRに蒸留する。
第2に、画像リアリズムを改善し、生成画像の高周波アーティファクト問題に対処するために、テレビLPIPSを知覚的損失として提案する。
論文 参考訳(メタデータ) (2025-02-04T04:11:29Z) - SinSR: Diffusion-Based Image Super-Resolution in a Single Step [119.18813219518042]
拡散モデルに基づく超解像(SR)法は有望な結果を示す。
しかし、それらの実践的応用は、必要な推論ステップのかなりの数によって妨げられている。
本稿では,SinSRという単一ステップのSR生成を実現するための,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-23T16:21:29Z) - Unsupervised Single Image Super-resolution Under Complex Noise [60.566471567837574]
本稿では,一般のSISRタスクを未知の劣化で扱うためのモデルベースunsupervised SISR法を提案する。
提案手法は, より小さなモデル (0.34M vs. 2.40M) だけでなく, より高速な技術 (SotA) 法 (約1dB PSNR) の現況を明らかに超えることができる。
論文 参考訳(メタデータ) (2021-07-02T11:55:40Z) - SRDiff: Single Image Super-Resolution with Diffusion Probabilistic
Models [19.17571465274627]
単一の画像スーパーリゾリューション(SISR)は、与えられた低リゾリューション(LR)画像から高解像度(HR)画像を再構成することを目的とする。
新規な単像超解像拡散確率モデル(SRDiff)を提案する。
SRDiffはデータ可能性の変動境界の変種に最適化されており、多様で現実的なSR予測を提供することができる。
論文 参考訳(メタデータ) (2021-04-30T12:31:25Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。