論文の概要: Co-learning Single-Step Diffusion Upsampler and Downsampler with Two Discriminators and Distillation
- arxiv url: http://arxiv.org/abs/2410.07663v3
- Date: Tue, 11 Mar 2025 10:53:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 19:16:21.059443
- Title: Co-learning Single-Step Diffusion Upsampler and Downsampler with Two Discriminators and Distillation
- Title(参考訳): 2つの識別器と蒸留器を用いた単段拡散アップサンプラーとダウンサンプラーの共学習
- Authors: Sohwi Kim, Tae-Kyun Kim,
- Abstract要約: 超解像度(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としている。
単段階拡散に基づくアップサンプラーと学習可能なダウンサンプラーを協調的に最適化するコラーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 28.174638880324014
- License:
- Abstract: Super-resolution (SR) aims to reconstruct high-resolution (HR) images from their low-resolution (LR) counterparts, often relying on effective downsampling to generate diverse and realistic training pairs. In this work, we propose a co-learning framework that jointly optimizes a single-step diffusion-based upsampler and a learnable downsampler, enhanced by two discriminators and a cyclic distillation strategy. Our learnable downsampler is designed to better capture realistic degradation patterns while preserving structural details in the LR domain, which is crucial for enhancing SR performance. By leveraging a diffusion-based approach, our model generates diverse LR-HR pairs during training, enabling robust learning across varying degradations. We demonstrate the effectiveness of our method on both general real-world and domain-specific face SR tasks, achieving state-of-the-art performance in both fidelity and perceptual quality. Our approach not only improves efficiency with a single inference step but also ensures high-quality image reconstruction, bridging the gap between synthetic and real-world SR scenarios.
- Abstract(参考訳): 超高解像度(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としており、しばしば多彩で現実的なトレーニングペアを生成するために効果的なダウンサンプリングに依存している。
本研究では, 単段階拡散に基づくアップサンプラーと学習可能なダウンサンプラーを共同で最適化し, 2つの識別器と循環蒸留戦略で強化したコラーニングフレームワークを提案する。
我々の学習可能なダウンサンプラーは、SR性能の向上に不可欠であるLRドメインの構造的詳細を保存しながら、現実的な劣化パターンをよりよく捉えるように設計されている。
拡散に基づくアプローチを利用することで、トレーニング中に様々なLR-HRペアを生成し、様々な劣化に対して堅牢な学習を可能にする。
本研究では,本手法が実世界とドメイン固有の顔SRタスクの両方に与える影響を実証し,忠実度と知覚品質の両面で最先端の性能を実現する。
提案手法は,単一の推論ステップで効率を向上するだけでなく,高品質な画像再構成を実現し,合成SRシナリオと実世界のSRシナリオのギャップを埋める。
関連論文リスト
- Distillation-Free One-Step Diffusion for Real-World Image Super-Resolution [81.81748032199813]
蒸留不要1ステップ拡散モデルを提案する。
具体的には、敵対的訓練に参加するためのノイズ認識識別器(NAD)を提案する。
我々は、エッジ対応disTS(EA-DISTS)による知覚損失を改善し、詳細な情報を生成するモデルの能力を向上させる。
論文 参考訳(メタデータ) (2024-10-05T16:41:36Z) - Effective Diffusion Transformer Architecture for Image Super-Resolution [63.254644431016345]
画像超解像のための効果的な拡散変換器(DiT-SR)を設計する。
実際には、DiT-SRは全体のU字型アーキテクチャを活用し、すべての変圧器ブロックに対して均一な等方性設計を採用する。
我々は、広く使われているAdaLNの制限を分析し、周波数適応型時間-ステップ条件付けモジュールを提案する。
論文 参考訳(メタデータ) (2024-09-29T07:14:16Z) - Taming Diffusion Prior for Image Super-Resolution with Domain Shift SDEs [36.65594293655289]
DoSSRは、事前訓練された拡散モデルの生成力を生かしたドメインシフト拡散に基づくSRモデルである。
このアプローチの核となるのは、既存の拡散モデルとシームレスに統合されるドメインシフト方程式です。
提案手法は, 合成および実世界のデータセットに対して, 5つのサンプリングステップしか必要とせず, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-09-26T12:16:11Z) - Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors [75.24313405671433]
拡散に基づく画像超解像法 (SR) は、事前訓練された大規模なテキスト・画像拡散モデルを先行として活用することにより、顕著な成功を収めた。
本稿では,拡散型SR手法の効率問題に対処する新しい一段階SRモデルを提案する。
既存の微調整戦略とは異なり、SR専用の劣化誘導低ランク適応 (LoRA) モジュールを設計した。
論文 参考訳(メタデータ) (2024-09-25T16:15:21Z) - One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文 参考訳(メタデータ) (2024-08-14T11:47:22Z) - SinSR: Diffusion-Based Image Super-Resolution in a Single Step [119.18813219518042]
拡散モデルに基づく超解像(SR)法は有望な結果を示す。
しかし、それらの実践的応用は、必要な推論ステップのかなりの数によって妨げられている。
本稿では,SinSRという単一ステップのSR生成を実現するための,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-23T16:21:29Z) - ResShift: Efficient Diffusion Model for Image Super-resolution by
Residual Shifting [70.83632337581034]
拡散に基づく画像超解像法(SR)は主に低推論速度によって制限される。
本稿では,SRの拡散段数を大幅に削減する新しい,効率的な拡散モデルを提案する。
本手法は,残差をシフトすることで高分解能画像と低分解能画像の間を移動させるマルコフ連鎖を構成する。
論文 参考訳(メタデータ) (2023-07-23T15:10:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。