論文の概要: SP-MoMamba: Superpixel-driven Mixture of State Space Experts for Efficient Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2605.25892v1
- Date: Mon, 25 May 2026 14:19:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:20.327194
- Title: SP-MoMamba: Superpixel-driven Mixture of State Space Experts for Efficient Image Super-Resolution
- Title(参考訳): SP-MoMamba:高効率超解像のための超画素駆動による状態空間エキスパートの混合
- Authors: Wenbin Zou, Yawen Cui, Yi Wang, Lap-Pui Chau, Liang Chen, Jinshan Pan, Huiping Zhuang, Guanbin Li,
- Abstract要約: 状態空間モデル(SSM)は、効率的な単一画像超解像(SR)のための強力なパラダイムとして登場した。
我々は、コンテント対応SRのための状態空間の専門家による超ピクセル駆動の混合である textbfSP-MoMamba を提案する。
私たちの中核となる考え方は、従来の剛性スキャンを、スーパーピクセルを基本単位として扱うことによって、テキストのセマンティックなレベルのインタラクションに変換することです。
- 参考スコア(独自算出の注目度): 99.56535031145211
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State space models (SSMs) have emerged as a powerful paradigm for efficient single-image super-resolution (SR) due to their linear complexity and long-range modeling capabilities. However, existing Mamba-based methods typically rely on data-agnostic rigid scanning, which reshapes 2D images into 1D sequences over a fixed grid, inevitably disrupting spatial-semantic topology and introducing artifacts. Inspired by the \textbf{Gestalt perceptual grouping theory}, we propose \textbf{SP-MoMamba}, a superpixel-driven mixture of state space experts designed for content-aware SR. Our core idea is to transform the traditional rigid scanning into a \textbf{semantic-level interaction} by treating superpixels as fundamental units. Specifically, we introduce the \textbf{Superpixel-driven State Space Model (SP-SSM)}, which compresses semantically homogeneous regions into high-order tokens to preserve global topological consistency. To address the conflict between fixed scanning scales and diverse semantic granularities, we develop the \textbf{Multi-Scale Superpixel Mixture of State Space Experts (MSS-MoE)}. This module utilizes a dynamic routing mechanism to adaptively assign scale-specific experts, effectively capturing multi-scale textures while reducing computational redundancy. Furthermore, to prevent the loss of high-frequency details during global abstraction, we introduce a \textbf{Local Spatial Modulation Expert (LSME)} to complement the global modeling, ensuring a precise reconstruction of sharp edges and fine structures. Extensive experiments on standard benchmarks demonstrate that SP-MoMamba achieves superior reconstruction fidelity and a more favorable efficiency-performance trade-off compared to state-of-the-art efficient SR methods.
- Abstract(参考訳): 状態空間モデル(SSM)は、線形複雑性と長距離モデリング能力のため、効率的な単一画像超解像(SR)のための強力なパラダイムとして登場した。
しかし、既存のMambaベースの手法は通常、データに依存しない剛性スキャンに依存しており、2D画像を固定格子上の1Dシーケンスに再結合し、必然的に空間意味的トポロジーを乱し、アーティファクトを導入する。
感性グルーピング理論(英語版)に着想を得て、コンテント対応SRのために設計された状態空間の専門家による超ピクセル駆動の混合である \textbf{SP-MoMamba} を提案する。
我々の中心となる考え方は、スーパーピクセルを基本単位として扱うことによって、従来の剛性走査を \textbf{semantic-level interaction} に変換することである。
具体的には,大域的トポロジ的整合性を維持するために,意味的に同質な領域を高次トークンに圧縮する「textbf{Superpixel-driven State Space Model (SP-SSM)」を導入する。
固定走査スケールと多種多様な意味的粒度の相違に対処するため,国家宇宙専門家の超画素混合法(MSS-MoE)}を開発した。
このモジュールは動的ルーティング機構を使用して、スケール固有の専門家を適応的に割り当て、計算冗長性を低減しつつ、マルチスケールのテクスチャを効果的にキャプチャする。
さらに,グローバル抽象化における高頻度の詳細の喪失を防止するため,グローバルモデリングを補完し,シャープエッジや微細構造を正確に再構築する「textbf{Local Spatial Modulation Expert (LSME)」を導入する。
標準ベンチマーク実験により,SP-MoMambaは,最先端のSR手法と比較して,より優れた再構成精度と良好な効率トレードオフを実現することが示された。
関連論文リスト
- Universal Pansharpening Foundation Model [67.10467574892282]
高分解能マルチスペクトル(MS)画像は、テクスチャリッチパンクロマティック(PAN)画像と低分解能MS画像からのスペクトル特性から空間的詳細を統合することで生成する。
本稿では,衛星非依存およびシーンロバスト融合のための普遍的パンシャーピング基盤モデルFoundPSを提案する。
論文 参考訳(メタデータ) (2026-03-04T08:30:15Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - HSRMamba: Contextual Spatial-Spectral State Space Model for Single Image Hyperspectral Super-Resolution [41.93421212397078]
Mambaは、その強力なグローバルモデリング能力と線形計算複雑性のために、視覚タスクにおいて例外的な性能を示した。
HSRMambaはハイパースペクトル画像超解像(HSISR)のための文脈空間スペクトルモデリング状態空間モデルである
論文 参考訳(メタデータ) (2025-01-30T17:10:53Z) - $\text{S}^{3}$Mamba: Arbitrary-Scale Super-Resolution via Scaleable State Space Model [45.65903826290642]
ASSRは、1つのモデルを用いて、任意のスケールで低解像度画像を高解像度画像に超解き放つことを目的としている。
拡張性のある連続表現空間を構築するために,$textS3$Mambaと呼ばれる新しい任意のスケール超解法を提案する。
論文 参考訳(メタデータ) (2024-11-16T11:13:02Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Unsupervised Hyperspectral and Multispectral Images Fusion Based on the
Cycle Consistency [21.233354336608205]
本稿では,CycFusionと呼ばれるサイクル一貫性に基づく教師なしHSIとMSIの融合モデルを提案する。
CycFusion は低空間分解能 HSI (LrHSI) と高空間分解能 MSI (HrMSI) の領域変換を学習する
いくつかのデータセットで行った実験により,提案手法は非教師なし核融合法よりも優れていたことが判明した。
論文 参考訳(メタデータ) (2023-07-07T06:47:15Z) - Hyperspectral Image Super-resolution via Deep Progressive Zero-centric
Residual Learning [62.52242684874278]
空間情報とスペクトル情報の相互モダリティ分布が問題となる。
本稿では,PZRes-Netという,新しいテクスライトウェイトなディープニューラルネットワークベースのフレームワークを提案する。
本フレームワークは,高分解能かつテクテッセロ中心の残像を学習し,シーンの空間的詳細を高頻度で表現する。
論文 参考訳(メタデータ) (2020-06-18T06:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。