Fugu-MT 論文翻訳(概要): Noise-Started One-Step Real-World Super-Resolution via LR-Conditioned SplitMeanFlow and GAN Refinement

論文の概要: Noise-Started One-Step Real-World Super-Resolution via LR-Conditioned SplitMeanFlow and GAN Refinement

arxiv url: http://arxiv.org/abs/2605.09328v1
Date: Sun, 10 May 2026 05:01:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-12 23:28:50.193666
Title: Noise-Started One-Step Real-World Super-Resolution via LR-Conditioned SplitMeanFlow and GAN Refinement
Title（参考訳）: LR-conditioned SplitMean FlowとGANリファインメントによる一段階実世界の超解像
Authors: Wei Zhu, Kai Zhang, Yu Zheng, Lei Luo, Yong Guo, Jian Yang,
Abstract要約: 本稿では、LR条件の SplitMeanFlow と GAN の改良によるノイズスタート1ステップの Real-ISR フレームワークを提案する。 SMFSRは1ステップ拡散に基づくReal-ISR法において、高速な単一ステップ推論を維持しながら最先端の品質を実現する。
参考スコア（独自算出の注目度）: 32.05719533625606
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Pre-trained text-to-image (T2I) diffusion models have shown strong potential for real-world image super-resolution (Real-ISR), owing to their noise-started generation process that enables realistic texture synthesis and captures the one-to-many nature of super-resolution. However, diffusion-based Real-ISR methods still face a fundamental efficiency-quality trade-off. Multi-step methods generate high-quality results by iteratively denoising random Gaussian noise under LR conditioning, but suffer from slow sampling. Recent one-step methods greatly improve efficiency, yet they typically replace noise-started generation with direct LR-to-HR restoration, which weakens stochasticity and limits realistic detail synthesis. To address this issue, we propose SMFSR, a noise-started one-step Real-ISR framework via LR-conditioned SplitMeanFlow and GAN refinement. SMFSR preserves the random-noise starting point of diffusion models and learns a direct noise-to-HR mapping conditioned on the LR image. To this end, Interval Splitting Consistency distills the multi-step generative trajectory into a single average-velocity prediction, enabling efficient one-step generation. To compensate for the reduced opportunity for progressive refinement, we further introduce a GAN refinement stage, where a DINOv3-based discriminator enhances realistic texture synthesis and variational score distillation aligns the generated outputs with the natural image distribution under a frozen diffusion teacher. Extensive experiments demonstrate that SMFSR achieves state-of-the-art perceptual quality among one-step diffusion-based Real-ISR methods while retaining fast single-step inference.
Abstract（参考訳）: 事前学習されたテキスト・ツー・イメージ(T2I)拡散モデルは、現実的なテクスチャ合成を可能にし、超解像の1対多の性質を捉えたノイズスタート生成プロセスにより、現実世界の超解像(Real-ISR)に強い可能性を示している。しかし、拡散に基づくReal-ISR法は依然として基本的な効率品質のトレードオフに直面している。多段法はLR条件下でランダムガウス雑音を反復的にデノベートすることで高品質な結果を生成するが、サンプリングの遅さに悩まされる。最近の一段階法は効率を大幅に改善するが、通常、ノイズスタートした世代をLR-to-HRの直接復元に置き換え、確率性を弱め、現実的な詳細合成を制限している。この問題に対処するために,LR条件の SplitMeanFlow と GAN によるノイズスタート1ステップの Real-ISR フレームワーク SMFSR を提案する。 SMFSRは拡散モデルのランダムノイズ開始点を保存し、LR画像に条件付き直接ノイズ対HRマッピングを学習する。この目的のために、インターバル分割一貫性は、多段階生成軌道を単一の平均速度予測に蒸留し、効率的なワンステップ生成を可能にする。 DINOv3をベースとした識別器が現実的なテクスチャ合成を強化し、変動スコアの蒸留により生成した出力を凍結拡散教師の下で自然な画像分布に整合させる。 SMFSRは1ステップ拡散に基づくReal-ISR法において、高速な単一ステップ推論を維持しながら、最先端の知覚品質を達成することを示した。

論文の概要: Noise-Started One-Step Real-World Super-Resolution via LR-Conditioned SplitMeanFlow and GAN Refinement

関連論文リスト