論文の概要: One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation
- arxiv url: http://arxiv.org/abs/2503.13358v1
- Date: Mon, 17 Mar 2025 16:44:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:30:00.594708
- Title: One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation
- Title(参考訳): 画像超解像における1ステップ残基シフト拡散
- Authors: Daniil Selikhanovych, David Li, Aleksei Leonov, Nikita Gushchin, Sergei Kushneriuk, Alexander Filippov, Evgeny Burnaev, Iaroslav Koshelev, Alexander Korotin,
- Abstract要約: 超解像(SR)の拡散モデルは高品質な視覚結果を生成するが、高価な計算コストを必要とする。
本稿では,拡散型SRモデルの1つであるResShiftの新しい蒸留法であるRSDを提案する。
本手法は,学生ネットワークを訓練し,その上で訓練した新しい偽ResShiftモデルが教師モデルと一致するような画像を生成することに基づいている。
- 参考スコア(独自算出の注目度): 90.84654430620971
- License:
- Abstract: Diffusion models for super-resolution (SR) produce high-quality visual results but require expensive computational costs. Despite the development of several methods to accelerate diffusion-based SR models, some (e.g., SinSR) fail to produce realistic perceptual details, while others (e.g., OSEDiff) may hallucinate non-existent structures. To overcome these issues, we present RSD, a new distillation method for ResShift, one of the top diffusion-based SR models. Our method is based on training the student network to produce such images that a new fake ResShift model trained on them will coincide with the teacher model. RSD achieves single-step restoration and outperforms the teacher by a large margin. We show that our distillation method can surpass the other distillation-based method for ResShift - SinSR - making it on par with state-of-the-art diffusion-based SR distillation methods. Compared to SR methods based on pre-trained text-to-image models, RSD produces competitive perceptual quality, provides images with better alignment to degraded input images, and requires fewer parameters and GPU memory. We provide experimental results on various real-world and synthetic datasets, including RealSR, RealSet65, DRealSR, ImageNet, and DIV2K.
- Abstract(参考訳): 超解像(SR)の拡散モデルは高品質な視覚結果を生成するが、高価な計算コストを必要とする。
拡散ベースのSRモデルを加速するいくつかの方法の開発にもかかわらず、いくつかの(例えば、SinSR)は現実的な知覚の詳細を生成できず、他の(例えば、OSEDiff)は存在しない構造を幻覚させる。
これらの問題を克服するために, 拡散型SRモデルの1つである ResShift の蒸留法である RSD を提案する。
本手法は,学生ネットワークを訓練し,その上で訓練した新しい偽ResShiftモデルが教師モデルと一致するような画像を生成することに基づいている。
RSDはシングルステップの復元を達成し、大きなマージンで教師を上回ります。
本研究では, 蒸留法がResShift-SinSRの他の蒸留法より優れていることを示す。
事前訓練されたテキスト・ツー・イメージモデルに基づくSR手法と比較して、RSDは競争力のある知覚品質を実現し、劣化した入力画像との整合性を高め、パラメータやGPUメモリを少なくする。
本稿では,RealSR,RealSet65,DRealSR,ImageNet,DIV2Kなどの実世界および合成データセットについて実験を行った。
関連論文リスト
- One Diffusion Step to Real-World Super-Resolution via Flow Trajectory Distillation [60.54811860967658]
FluxSRはフローマッチングモデルに基づく新しい一段階拡散リアルISRである。
まず,フロートラジェクトリ蒸留(FTD)を導入し,多段階のフローマッチングモデルを1段階のリアルISRに蒸留する。
第2に、画像リアリズムを改善し、生成画像の高周波アーティファクト問題に対処するために、テレビLPIPSを知覚的損失として提案する。
論文 参考訳(メタデータ) (2025-02-04T04:11:29Z) - TSD-SR: One-Step Diffusion with Target Score Distillation for Real-World Image Super-Resolution [25.994093587158808]
事前訓練されたテキスト-画像拡散モデルが、現実の画像超解像(Real-ISR)タスクにますます応用されている。
拡散モデルの反復的洗練された性質を考えると、既存のアプローチのほとんどは計算的に高価である。
実世界の超高解像度画像に特化して設計された新しい蒸留フレームワークであるTLD-SRを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:01:08Z) - One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文 参考訳(メタデータ) (2024-08-14T11:47:22Z) - Burst Super-Resolution with Diffusion Models for Improving Perceptual Quality [12.687175237915019]
バーストLR画像を受け入れる以前のSRネットワークは、曖昧なSR画像を生成することが知られている決定論的方法で訓練される。
このようなぼやけた画像は知覚的に劣化しているので、我々は鋭い高忠実度境界を再構築することを目指している。
一方,提案手法では,初期バーストSR画像の再構成にバーストLR特性を用いる。
論文 参考訳(メタデータ) (2024-03-28T13:58:05Z) - SinSR: Diffusion-Based Image Super-Resolution in a Single Step [119.18813219518042]
拡散モデルに基づく超解像(SR)法は有望な結果を示す。
しかし、それらの実践的応用は、必要な推論ステップのかなりの数によって妨げられている。
本稿では,SinSRという単一ステップのSR生成を実現するための,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-23T16:21:29Z) - Efficient Test-Time Adaptation for Super-Resolution with Second-Order
Degradation and Reconstruction [62.955327005837475]
画像超解像(SR)は,低分解能(LR)から高分解能(HR)へのマッピングを,一対のHR-LRトレーニング画像を用いて学習することを目的としている。
SRTTAと呼ばれるSRの効率的なテスト時間適応フレームワークを提案し、SRモデルを異なる/未知の劣化型でテストドメインに迅速に適応させることができる。
論文 参考訳(メタデータ) (2023-10-29T13:58:57Z) - Knowledge Distillation based Degradation Estimation for Blind
Super-Resolution [146.0988597062618]
Blind画像超解像(Blind-SR)は、対応する低解像度(LR)入力画像から高解像度(HR)画像を未知の劣化で復元することを目的としている。
劣化推定器のトレーニングを監督するために、複数の劣化組合せの具体的なラベルを提供することは不可能である。
本稿では,知識蒸留に基づく暗黙劣化推定ネットワーク(KD-IDE)と効率的なSRネットワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T11:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。