論文の概要: Accelerating Diffusion-based Super-Resolution with Dynamic Time-Spatial Sampling
- arxiv url: http://arxiv.org/abs/2505.12048v2
- Date: Wed, 21 May 2025 07:30:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 13:19:52.319424
- Title: Accelerating Diffusion-based Super-Resolution with Dynamic Time-Spatial Sampling
- Title(参考訳): 動的時空間サンプリングによる拡散型超解像の高速化
- Authors: Rui Qin, Qijie Wang, Ming Sun, Haowei Zhu, Chao Zhou, Bin Wang,
- Abstract要約: 拡散SRの加速のための時間空間対応サンプリング戦略(TSS)には、追加の訓練費用がかからない。
TSS は TSS State-of-the-art (SOTA) のパフォーマンスを極めて少ないイテレーションで達成し、MUSIQ のスコアを 0.2 - 3.0 で改善し、現在の加速度法を半分のステップ数で上回っている。
- 参考スコア(独自算出の注目度): 8.574255193743777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models have gained attention for their success in modeling complex distributions, achieving impressive perceptual quality in SR tasks. However, existing diffusion-based SR methods often suffer from high computational costs, requiring numerous iterative steps for training and inference. Existing acceleration techniques, such as distillation and solver optimization, are generally task-agnostic and do not fully leverage the specific characteristics of low-level tasks like super-resolution (SR). In this study, we analyze the frequency- and spatial-domain properties of diffusion-based SR methods, revealing key insights into the temporal and spatial dependencies of high-frequency signal recovery. Specifically, high-frequency details benefit from concentrated optimization during early and late diffusion iterations, while spatially textured regions demand adaptive denoising strategies. Building on these observations, we propose the Time-Spatial-aware Sampling strategy (TSS) for the acceleration of Diffusion SR without any extra training cost. TSS combines Time Dynamic Sampling (TDS), which allocates more iterations to refining textures, and Spatial Dynamic Sampling (SDS), which dynamically adjusts strategies based on image content. Extensive evaluations across multiple benchmarks demonstrate that TSS achieves state-of-the-art (SOTA) performance with significantly fewer iterations, improving MUSIQ scores by 0.2 - 3.0 and outperforming the current acceleration methods with only half the number of steps.
- Abstract(参考訳): 拡散モデルは複雑な分布をモデル化することに成功し、SRタスクにおいて印象的な知覚品質を達成している。
しかし、既存の拡散ベースのSR法は、しばしば高い計算コストに悩まされ、訓練と推論のために多くの反復的なステップを必要とする。
蒸留やソルバ最適化のような既存の加速技術は一般にタスクに依存しず、超解像(SR)のような低レベルのタスクの特定の特性を十分に活用していない。
本研究では,拡散型SR法の周波数領域特性と空間領域特性を分析し,高周波信号回復の時間的および空間的依存性に関する重要な知見を明らかにする。
特に、高周波の詳細は、初期および後期の拡散繰り返しにおける集中的な最適化の恩恵を受け、空間的にテクスチャ化された領域は適応的な復調戦略を要求する。
これらの観測に基づいて,拡散SRの加速のための時間空間対応サンプリング戦略 (TSS) を提案する。
TSSは、テクスチャの精製により多くのイテレーションを割り当てるTime Dynamic Sampling(TDS)と、画像コンテンツに基づいて戦略を動的に調整するSDS(Spatial Dynamic Sampling)を組み合わせる。
複数のベンチマークで広範囲な評価を行った結果、TSSは比較的少ないイテレーションで最先端(SOTA)性能を実現し、MUSIQのスコアを0.2~3.0改善し、現在の加速度法を半分のステップで上回った。
関連論文リスト
- Rethinking the Upsampling Layer in Hyperspectral Image Super Resolution [51.98465973507002]
ハイパースペクトル画像のマルチスケールチャネル特性のキャリブレーションにチャネルアテンションを組み込んだ,新しい軽量SHSRネットワーク LKCA-Net を提案する。
我々は、学習可能なアップサンプリング層の低ランク特性が軽量なSHSR手法における重要なボトルネックであることを初めて証明した。
論文 参考訳(メタデータ) (2025-01-30T15:43:34Z) - HSIDMamba: Exploring Bidirectional State-Space Models for Hyperspectral Denoising [11.022546457796949]
本研究では,HSIにおける空間スペクトル依存性を効果的に捉えるために,線形複雑性を利用したHSIDMamba(HSDM)を提案する。
HSDMは複数のハイパースペクトル連続走査ブロックから構成され、BCSM(Bidirectional Continuous Scanning Mechanism)、スケール残留、スペクトル注意機構が組み込まれている。
BCSMは、前向きと後向きのスキャンをリンクし、SSMを介して8方向の情報を強化することにより、空間-スペクトル相互作用を強化する。
論文 参考訳(メタデータ) (2024-04-15T11:59:19Z) - sasdim: self-adaptive noise scaling diffusion model for spatial time
series imputation [22.881248410404126]
空間的時系列計算を行うために,SASDimという自己適応型ノイズスケーリング拡散モデルを提案する。
具体的には、同様の強度に雑音を拡大できる新しい損失関数を提案し、空間的・時間的大域的畳み込みモジュールを提案する。
論文 参考訳(メタデータ) (2023-09-05T06:51:39Z) - ResShift: Efficient Diffusion Model for Image Super-resolution by
Residual Shifting [70.83632337581034]
拡散に基づく画像超解像法(SR)は主に低推論速度によって制限される。
本稿では,SRの拡散段数を大幅に削減する新しい,効率的な拡散モデルを提案する。
本手法は,残差をシフトすることで高分解能画像と低分解能画像の間を移動させるマルコフ連鎖を構成する。
論文 参考訳(メタデータ) (2023-07-23T15:10:02Z) - DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for
Hyperspectral Image Restoration [103.79030498369319]
ハイパースペクトル画像復元のための自己教師付き拡散モデルを提案する。
textttDDS2Mは、既存の拡散法と比較して、より強力な一般化能力を持っている。
HSIのノイズ除去、ノイズ除去、様々なHSIの超解像実験は、既存のタスク固有状態よりもtextttDDS2Mの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-03-12T14:57:04Z) - Algorithmic Hallucinations of Near-Surface Winds: Statistical
Downscaling with Generative Adversarial Networks to Convection-Permitting
Scales [0.0]
我々は、畳み込みニューラルネットワークに基づくジェネレーティブ・アドバイサル・ネットワーク(GAN)に焦点を当てる。
気象調査と予測モデルシミュレーションを模擬した高分解能(HR)表面風を生成するために,我々は低分解能(LR)入力にGANを条件付けている。
本研究は、コンピュータビジョン分野からの新しい周波数分離(FS)アプローチを実験することにより、現在のSRに基づく統計的ダウンスケーリングに基づいている。
論文 参考訳(メタデータ) (2023-02-17T06:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。