論文の概要: Transformer-Progressive Mamba Network for Lightweight Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2511.03232v1
- Date: Wed, 05 Nov 2025 06:46:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-06 18:19:32.360156
- Title: Transformer-Progressive Mamba Network for Lightweight Image Super-Resolution
- Title(参考訳): 軽量画像超解像のためのトランスフォーマー・プログレッシブ・マンバネットワーク
- Authors: Sichen Guo, Wenjie Li, Yuanyang Liu, Guangwei Gao, Jian Yang, Chia-Wen Lin,
- Abstract要約: マンバをベースとした超解像法 (SR) は, 線形複雑度で大域的受容場を捉える能力を示した。
本稿では,ウィンドウベースの自己意識をプログレッシブ・マンバと統合した軽量SRフレームワークT-PMambaSRを提案する。
- 参考スコア(独自算出の注目度): 45.74812546007778
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, Mamba-based super-resolution (SR) methods have demonstrated the ability to capture global receptive fields with linear complexity, addressing the quadratic computational cost of Transformer-based SR approaches. However, existing Mamba-based methods lack fine-grained transitions across different modeling scales, which limits the efficiency of feature representation. In this paper, we propose T-PMambaSR, a lightweight SR framework that integrates window-based self-attention with Progressive Mamba. By enabling interactions among receptive fields of different scales, our method establishes a fine-grained modeling paradigm that progressively enhances feature representation with linear complexity. Furthermore, we introduce an Adaptive High-Frequency Refinement Module (AHFRM) to recover high-frequency details lost during Transformer and Mamba processing. Extensive experiments demonstrate that T-PMambaSR progressively enhances the model's receptive field and expressiveness, yielding better performance than recent Transformer- or Mamba-based methods while incurring lower computational cost. Our codes will be released after acceptance.
- Abstract(参考訳): 近年,マンバをベースとした超解像(SR)法は,線形複雑度で大域的受容場を捉える能力を示し,TransformerベースのSR手法の2次計算コストに対処している。
しかし、既存のMambaベースの手法では、様々なモデリングスケールの細かい遷移が欠如しており、特徴表現の効率が制限されている。
本稿では,ウィンドウベースの自己意識をプログレッシブ・マンバと統合した軽量SRフレームワークT-PMambaSRを提案する。
本手法は,異なるスケールの受容場間の相互作用を可能とすることにより,線形複雑性を伴う特徴表現を段階的に強化する,きめ細かなモデリングパラダイムを確立する。
さらに、TransformerおよびMamba処理中に失われた高周波の詳細を復元するために、適応型高周波リファインメントモジュール(AHFRM)を導入する。
大規模な実験により、T-PMambaSRはモデルの受容場と表現性を徐々に向上させ、計算コストを下げつつ、最近のTransformerやMambaベースの手法よりも優れた性能が得られることが示された。
私たちのコードは受理後に解放されます。
関連論文リスト
- Trained Mamba Emulates Online Gradient Descent in In-Context Linear Regression [90.93281146423378]
Mambaは、Long-Sequence Modelingのための線形複雑性を持つ効率的なTransformer代替品である。
最近の実証研究は、Mambaのテキスト内学習(ICL)がTransformersと競合していることを示している。
本稿では,線形回帰 ICL タスクにおける Mamba のトレーニングダイナミクスについて検討する。
論文 参考訳(メタデータ) (2025-09-28T09:48:49Z) - MambaStyle: Efficient StyleGAN Inversion for Real Image Editing with State-Space Models [60.110274007388135]
MambaStyleは、GANインバージョンと編集のための効率的なシングルステージエンコーダベースのアプローチである。
MambaStyleは、逆精度、編集品質、計算効率のバランスが優れていることを示す。
論文 参考訳(メタデータ) (2025-05-06T20:03:47Z) - TransMamba: Flexibly Switching between Transformer and Mamba [43.20757187382281]
本稿ではTransformerとMambaを統合するフレームワークであるTransMambaを提案する。
本研究では,TransMambaがベースラインよりも優れたトレーニング効率と性能を実現することを示す。
論文 参考訳(メタデータ) (2025-03-31T13:26:24Z) - Mamba-SEUNet: Mamba UNet for Monaural Speech Enhancement [54.427965535613886]
Mambaは、新しいステートスペースモデル(SSM)として、自然言語処理やコンピュータビジョンに広く応用されている。
本稿では,MambaとU-Net for SEタスクを統合する革新的なアーキテクチャであるMamba-SEUNetを紹介する。
論文 参考訳(メタデータ) (2024-12-21T13:43:51Z) - Integrating Multi-Modal Input Token Mixer Into Mamba-Based Decision Models: Decision MetaMamba [0.0]
状態空間モデル(SSM)を用いたシーケンスモデリングは、様々なタスクにおけるトランスフォーマーよりもパフォーマンスが優れていることを示した。
しかし、最先端のSSMであるMambaに基づく決定モデルは、拡張された決定変換器よりも優れた性能を達成できなかった。
本稿では,DMM(Decision MetaMamba)を提案する。
論文 参考訳(メタデータ) (2024-08-20T03:35:28Z) - LLEMamba: Low-Light Enhancement via Relighting-Guided Mamba with Deep Unfolding Network [9.987504237289832]
深部展開ネットワーク(LLEMamba)を用いた照明誘導型マンバによる新しい低照度化手法を提案する。
我々のLLEMambaは、まず、深く展開するネットワークに乗算器の交互方向法(ADMM)に基づく反復最適化過程を組み込んだ、深い事前を持つRetinexモデルを構築した。
Transformerとは異なり、複数のイテレーションで深層展開フレームワークを支援するため、LLEMambaは計算複雑性の低い新しいMambaアーキテクチャを導入した。
論文 参考訳(メタデータ) (2024-06-03T06:23:28Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。