論文の概要: Structural Similarity-Inspired Unfolding for Lightweight Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2506.11823v1
- Date: Fri, 13 Jun 2025 14:29:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.829642
- Title: Structural Similarity-Inspired Unfolding for Lightweight Image Super-Resolution
- Title(参考訳): 軽量画像超解像のための構造的類似性を考慮した展開
- Authors: Zhangkai Ni, Yang Zhang, Wenhan Yang, Hanli Wang, Shiqi Wang, Sam Kwong,
- Abstract要約: 効率的な画像SRのための構造類似インスパイアド・アンフォールディング(SSIU)法を提案する。
この方法は、構造的類似性に制約されたSR最適化関数の展開によって設計される。
我々のモデルは現在の最先端モデルより優れており、パラメータ数が低く、メモリ消費が減少している。
- 参考スコア(独自算出の注目度): 88.20464308588889
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Major efforts in data-driven image super-resolution (SR) primarily focus on expanding the receptive field of the model to better capture contextual information. However, these methods are typically implemented by stacking deeper networks or leveraging transformer-based attention mechanisms, which consequently increases model complexity. In contrast, model-driven methods based on the unfolding paradigm show promise in improving performance while effectively maintaining model compactness through sophisticated module design. Based on these insights, we propose a Structural Similarity-Inspired Unfolding (SSIU) method for efficient image SR. This method is designed through unfolding an SR optimization function constrained by structural similarity, aiming to combine the strengths of both data-driven and model-driven approaches. Our model operates progressively following the unfolding paradigm. Each iteration consists of multiple Mixed-Scale Gating Modules (MSGM) and an Efficient Sparse Attention Module (ESAM). The former implements comprehensive constraints on features, including a structural similarity constraint, while the latter aims to achieve sparse activation. In addition, we design a Mixture-of-Experts-based Feature Selector (MoE-FS) that fully utilizes multi-level feature information by combining features from different steps. Extensive experiments validate the efficacy and efficiency of our unfolding-inspired network. Our model outperforms current state-of-the-art models, boasting lower parameter counts and reduced memory consumption. Our code will be available at: https://github.com/eezkni/SSIU
- Abstract(参考訳): データ駆動画像超解像(SR)の主な取り組みは、コンテキスト情報をよりよく捉えるために、モデルの受容領域を拡張することである。
しかし、これらの手法は通常、より深いネットワークを積み重ねたり、トランスフォーマーベースのアテンションメカニズムを活用して実装され、結果としてモデルの複雑さが増大する。
対照的に、展開パラダイムに基づくモデル駆動手法は、洗練されたモジュール設計によりモデルコンパクト性を効果的に維持しつつ、性能を向上させることを約束する。
これらの知見に基づいて,効率的な画像SRのための構造類似型展開法(SSIU)を提案する。
この手法は、構造的類似性に制約されたSR最適化関数の展開により設計され、データ駆動とモデル駆動の両方のアプローチの強みを組み合わせることを目的としている。
我々のモデルは展開パラダイムに従って徐々に機能する。
各イテレーションは複数のMGM(Mixed-Scale Gating Module)とESAM(Efficient Sparse Attention Module)で構成されている。
前者は構造的類似性制約を含む機能に関する包括的な制約を実装し、後者はスパースアクティベーションの実現を目指している。
また,Mixture-of-Experts-based Feature Selector (MoE-FS) の設計を行った。
広汎な実験により、展開にインスパイアされたネットワークの有効性と効率が検証された。
我々のモデルは現在の最先端モデルより優れており、パラメータ数が低く、メモリ消費が減少している。
私たちのコードは、https://github.com/eezkni/SSIUで利用可能です。
関連論文リスト
- DiMoSR: Feature Modulation via Multi-Branch Dilated Convolutions for Efficient Image Super-Resolution [7.714092783675679]
本稿では、軽量SISRネットワークにおける注目を補うために、変調による特徴表現を強化する新しいアーキテクチャであるDiMoSRを紹介する。
実験により、DiMoSRは様々なベンチマークデータセットで最先端の軽量メソッドよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-05-27T14:40:05Z) - Binarized Diffusion Model for Image Super-Resolution [61.963833405167875]
超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する
既存の二項化法では性能が著しく低下する。
画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文 参考訳(メタデータ) (2024-06-09T10:30:25Z) - A-SDM: Accelerating Stable Diffusion through Model Assembly and Feature Inheritance Strategies [51.7643024367548]
安定拡散モデルは、テキスト・ツー・イメージ(T2I)と画像・ツー・イメージ(I2I)生成のための一般的かつ効果的なモデルである。
本研究では、SDMにおける冗長計算の削減と、チューニング不要とチューニング不要の両方の手法によるモデルの最適化に焦点をあてる。
論文 参考訳(メタデータ) (2024-05-31T21:47:05Z) - Majority Kernels: An Approach to Leverage Big Model Dynamics for Efficient Small Model Training [32.154166415680066]
蒸留、圧縮、量子化といった手法は、高性能な大きなモデルを利用してより小さな性能のモデルを誘導するのに役立つ。
本稿では、単一トレーニングランが同時に、より大きなパフォーマンスモデルをトレーニングし、より小さなデプロイメントモデルを導出できるという仮説を考察する。
論文 参考訳(メタデータ) (2024-02-07T17:07:41Z) - A Lightweight Feature Fusion Architecture For Resource-Constrained Crowd
Counting [3.5066463427087777]
クラウドカウントモデルの汎用性を高めるために,2つの軽量モデルを導入する。
これらのモデルは、MobileNetとMobileViTという2つの異なるバックボーンを持ちながら、同じダウンストリームアーキテクチャを維持している。
隣接特徴融合を利用して、事前学習モデル(PTM)から多様な特徴を抽出し、その後、シームレスにこれらの特徴を組み合わせる。
論文 参考訳(メタデータ) (2024-01-11T15:13:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。