論文の概要: SlimDiffSR: Toward Lightweight and Efficient Remote Sensing Image Super-Resolution via Diffusion Model Distillation
- arxiv url: http://arxiv.org/abs/2605.02198v1
- Date: Mon, 04 May 2026 03:54:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.129537
- Title: SlimDiffSR: Toward Lightweight and Efficient Remote Sensing Image Super-Resolution via Diffusion Model Distillation
- Title(参考訳): SlimDiffSR:拡散モデル蒸留による軽量・高効率リモートセンシング画像超解像に向けて
- Authors: Ce Wang, Zhenyu Hu, Wanjie Sun,
- Abstract要約: SlimDiffSRは、現実世界のリモートセンシング画像の超高解像度化のための軽量で効率的な拡散ベースのフレームワークである。
推論アクセラレーションは最大200ドル、モデルパラメータはマルチステップの拡散モデルと比較して20ドルまで削減できる。
- 参考スコア(独自算出の注目度): 10.518150741228862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models have recently achieved remarkable performance in image super-resolution (SR), but their high computational cost limits practical deployment in remote sensing applications. To address this issue, we propose SlimDiffSR, a lightweight and efficient diffusion-based framework for real-world remote sensing image super-resolution. Unlike existing single-step diffusion methods that rely on fixed timesteps, we first introduce an uncertainty-guided timestep assignment strategy to construct a stronger single-step teacher model, where reconstruction difficulty is explicitly linked to diffusion timesteps, enabling adaptive generative strength. Building upon this teacher, we further present a structured pruning strategy tailored to remote sensing imagery, which systematically removes redundant semantic modules and replaces standard operations with lightweight designs, including frequency-separable convolution, direction-separable convolution, and a query-driven global aggregation module. These components explicitly exploit the unique characteristics of remote sensing data, such as sparse high-frequency details, strong directional patterns, and long-range spatial dependencies. To enhance knowledge transfer, we incorporate Maximum Mean Discrepancy (MMD) into the distillation process to align feature distributions between the teacher and student models. Extensive experiments on multiple remote sensing benchmarks demonstrate that SlimDiffSR achieves a favorable balance between efficiency and reconstruction quality. In particular, it attains up to $200\times$ inference acceleration and a $20\times$ reduction in model parameters compared with multi-step diffusion models, while achieving competitive perceptual quality and clearly outperforming existing lightweight diffusion baselines in efficiency. The code is available at: https://github.com/wwangcece/SlimDiffSR.
- Abstract(参考訳): 拡散モデルは最近、画像超解像(SR)において顕著な性能を達成しているが、その高い計算コストはリモートセンシングアプリケーションにおける実用的な展開を制限している。
この問題に対処するために,実世界のリモートセンシング画像の超高解像度化のための軽量かつ効率的な拡散ベースフレームワークであるSlimDiffSRを提案する。
固定時間ステップに依存する既存の単段階拡散法とは異なり、我々はまず、より強力な単段階教師モデルを構築するための不確実性誘導時間ステップ割り当て戦略を導入する。
この教師を基盤として、リモートセンシング画像に適した構造化プルーニング戦略を提案し、冗長なセマンティックモジュールを体系的に除去し、周波数分離可能な畳み込み、方向分離可能な畳み込み、クエリ駆動のグローバルアグリゲーションモジュールを含む軽量な設計で標準操作を置き換える。
これらのコンポーネントは、細かな高周波の詳細、強い方向パターン、長距離空間依存など、リモートセンシングデータのユニークな特性を明示的に活用する。
知識伝達の促進を目的として, 最大平均離散度(MMD)を蒸留プロセスに組み込んで, 教師モデルと学生モデルの特徴分布を整合させる。
複数のリモートセンシングベンチマークの大規模な実験により、SlimDiffSRは効率と再構築品質のバランスが良好であることが示された。
特に、最大200\times$推論アクセラレーションと20\times$モデルパラメータをマルチステップ拡散モデルと比較し、競争力のある知覚品質を実現し、既存の軽量拡散ベースラインを効率良く上回る。
コードは、https://github.com/wwangcece/SlimDiffSR.comで入手できる。
関連論文リスト
- HIMOSA: Efficient Remote Sensing Image Super-Resolution with Hierarchical Mixture of Sparse Attention [12.346708587151495]
HIMOSAは、リモートセンシング画像のための軽量超解像度フレームワークである。
本手法は計算効率を保ちながら最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-11-29T02:00:15Z) - SDAR: A Synergistic Diffusion-AutoRegression Paradigm for Scalable Sequence Generation [62.14510717860079]
本稿では, 自己回帰モデルの学習効率を, 拡散の並列推論能力で統一するSynergistic Diffusion-Autoregressionパラダイムを提案する。
SDARは、十分に訓練された自己回帰モデル(AR)を、簡潔でデータ効率のよい適応を通じてブロックワイズ拡散モデルに変換する、軽量なパラダイム変換を実行する。
この知見に基づいて、SDARは最小コストで効率的なAR-拡散変換を実現し、並列生成を可能にしながら、ARレベルのパフォーマンスを維持する。
論文 参考訳(メタデータ) (2025-10-07T17:29:28Z) - Single-Step Latent Consistency Model for Remote Sensing Image Super-Resolution [7.920423405957888]
RSISRタスクの効率性と視覚的品質を向上させるために,新しい単一ステップ拡散手法を提案する。
提案したLCMSRは,従来の拡散モデルの反復的なステップを50-1000以上から1ステップに短縮する。
実験の結果, LCMSRは効率と性能のバランスを効果的に保ち, 非拡散モデルに匹敵する推論時間を達成することがわかった。
論文 参考訳(メタデータ) (2025-03-25T09:56:21Z) - One Diffusion Step to Real-World Super-Resolution via Flow Trajectory Distillation [60.54811860967658]
FluxSRはフローマッチングモデルに基づく新しい一段階拡散リアルISRである。
まず,フロートラジェクトリ蒸留(FTD)を導入し,多段階のフローマッチングモデルを1段階のリアルISRに蒸留する。
第2に、画像リアリズムを改善し、生成画像の高周波アーティファクト問題に対処するために、テレビLPIPSを知覚的損失として提案する。
論文 参考訳(メタデータ) (2025-02-04T04:11:29Z) - Diffusion Spectral Representation for Reinforcement Learning [17.701625371409644]
本稿では,表現学習の観点からの強化学習に拡散モデルの柔軟性を活用することを提案する。
拡散モデルとエネルギーベースモデルとの接続を利用して拡散スペクトル表現(Diff-SR)を開発する。
Diff-SRは、拡散モデルからのサンプリングの難易度と推論コストを明示的に回避しつつ、効率的なポリシー最適化と実用的なアルゴリズムを実現する方法を示す。
論文 参考訳(メタデータ) (2024-06-23T14:24:14Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。