論文の概要: Progressive Split Mamba: Effective State Space Modelling for Image Restoration
- arxiv url: http://arxiv.org/abs/2603.09171v1
- Date: Tue, 10 Mar 2026 04:19:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:24.026557
- Title: Progressive Split Mamba: Effective State Space Modelling for Image Restoration
- Title(参考訳): プログレッシブ・スプリット・マンバ:画像復元のための効率的な状態空間モデリング
- Authors: Mohammed Hassanin, Nour Moustafa, Weijian Deng, Ibrahim Radwan,
- Abstract要約: 最近の状態空間モデル(SSM)は、長距離依存性モデリングの魅力的な線形時間代替を提供する。
PS-Mamba(PS-Mamba)は、局所性保存と効率的なグローバルな伝播を両立させるために設計されたトポロジ対応の階層的状態空間フレームワークである。
超解像、デノイング、JPEGアーティファクトの大幅な削減に関する実験は、最近のMambaベースおよび注目ベースモデルに対して、明確なマージンを持つ一貫した改善を示している。
- 参考スコア(独自算出の注目度): 19.506549697690396
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image restoration requires simultaneously preserving fine-grained local structures and maintaining long-range spatial coherence. While convolutional networks struggle with limited receptive fields, and Transformers incur quadratic complexity for global attention, recent State Space Models (SSMs), such as Mamba, provide an appealing linear-time alternative for long-range dependency modelling. However, naively extending Mamba to 2D images exposes two intrinsic shortcomings. First, flattening 2D feature maps into 1D sequences disrupts spatial topology, leading to locality distortion that hampers precise structural recovery. Second, the stability-driven recurrent dynamics of SSMs induce long-range decay, progressively attenuating information across distant spatial positions and weakening global consistency. Together, these effects limit the effectiveness of state-space modelling in high-fidelity restoration. We propose Progressive Split-Mamba (PS-Mamba), a topology-aware hierarchical state-space framework designed to reconcile locality preservation with efficient global propagation. Instead of sequentially flattening entire feature maps, PS-Mamba performs geometry-consistent partitioning, maintaining neighbourhood integrity prior to state-space processing. A progressive split hierarchy (halves, quadrants, octants) enables structured multi-scale modelling while retaining linear complexity. To counteract long-range decay, we introduce symmetric cross-scale shortcut pathways that directly transmit low-frequency global context across hierarchical levels, stabilising information flow over large spatial extents. Extensive experiments on super-resolution, denoising, and JPEG artifact reduction show consistent improvements over recent Mamba-based and attention-based models with a clear margin.
- Abstract(参考訳): 画像復元には、微細な局所構造を同時に保存し、長距離空間コヒーレンスを維持する必要がある。
畳み込みネットワークは限定的な受容場に苦しむ一方で、トランスフォーマーはグローバルな注目を集めるために二次的な複雑さを伴い、最近のステートスペースモデル(SSM)は長距離依存モデリングの魅力的な線形時間代替を提供する。
しかし、Mambaを2D画像にネーティブに拡張することは、2つの固有の欠点を露呈する。
まず、平らな2次元特徴写像を1次元配列に分割すると空間トポロジーが乱れ、局所性歪みが生じ、正確な構造回復が妨げられる。
第2に、SSMの安定性駆動リカレントダイナミクスは、長距離減衰を誘導し、徐々に遠方空間位置の情報を減衰させ、大域的な一貫性を弱める。
これらの効果により、高忠実度復元における状態空間モデリングの有効性が制限される。
我々は,局所性保存と効率的なグローバルな伝播を両立するトポロジ対応の階層的状態空間フレームワークであるProgressive Split-Mamba (PS-Mamba)を提案する。
特徴写像全体を逐次平坦化する代わりに、PS-Mambaは幾何整合分割を行い、状態空間処理の前に近傍の整合性を維持する。
プログレッシブスプリット階層(ハーフ、クワラント、オクタント)は、線形複雑性を維持しながら構造化されたマルチスケールモデリングを可能にする。
長距離減衰対策として,低周波大域文脈を階層的に直接伝達し,広い空間範囲にわたって情報の流れを安定化する対称的横断的ショートカット経路を導入する。
超解像、デノイング、JPEGアーティファクトの大幅な削減に関する実験は、最近のMambaベースおよび注目ベースモデルに対して、明確なマージンを持つ一貫した改善を示している。
関連論文リスト
- OCTOPUS: Enhancing the Spatial-Awareness of Vision SSMs with Multi-Dimensional Scans and Traversal Selection [20.717476762904038]
我々は,大域的コンテキストと画像内の局所空間構造の両方を保存する新しいアーキテクチャであるOCTOPUSを紹介する。
OCTOPUSは8つの主方向に沿って個別に再起し、水平方向、垂直方向、対角方向を前方または後方に進む。
分類とセグメンテーションのベンチマークでは、OCTOPUSは境界保存と領域の整合性において顕著な改善を示した。
論文 参考訳(メタデータ) (2026-01-31T21:12:59Z) - MambaX: Image Super-Resolution with State Predictive Control [48.76194230142064]
Mambaは、再構築プロセス全体を複数のノードによる状態シーケンスとして表現し、中間的介入を可能にする、有望なアプローチとして登場した。
我々は、連続するスペクトル帯域を潜在状態空間にマッピングする非線形状態予測制御モデル textbfMambaX を作成し、制御方程式の非線形状態パラメータを動的に学習することでSRタスクを一般化した。
本評価では, 単一像SRと多モード融合型SRの両タスクにおいて, 動的スペクトル状態表現モデルの優れた性能を示す。
論文 参考訳(メタデータ) (2025-11-22T11:44:09Z) - Gather-Scatter Mamba: Accelerating Propagation with Efficient State Space Model [15.551773379039675]
ステート・スペース・モデル(SSM)は歴史的にシーケンシャル・モデリングにおいて中心的な役割を果たしてきた。
Mambaのような選択型SSMの最近の進歩は、魅力的な代替手段を提供する。
本研究では,空間的コンテキストアグリゲーションのためのシフトウィンドウ自己アテンションと,効率的な時間的伝搬のためのマンバ型選択走査を組み合わせたハイブリッドアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-10-01T13:11:13Z) - Scaling Vision Mamba Across Resolutions via Fractal Traversal [9.566046692165884]
Vision MambaはTransformerベースのアーキテクチャに代わる有望な選択肢として最近登場した。
Hilbert曲線によるフラクタルベースのパッチシリアライゼーションを活用するビジョンバックボーンであるFractalMamba++を提案する。
FractalMamba++は、従来のMambaベースのバックボーンよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-05-20T08:08:28Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - Learning Phase Distortion with Selective State Space Models for Video Turbulence Mitigation [13.073844945948132]
大気の乱流は、長距離イメージングシステムにおける画像劣化の主な原因である。
多くの深層学習に基づく乱流緩和法 (TM) が提案されているが, それらは遅い, メモリ不足であり, 一般化が不十分である。
本稿では,(1)選択状態空間モデル(MambaTM)に基づく乱流緩和ネットワークと(2)学習遅延位相歪み(LPD)の2つの概念に基づく新しいTM法を提案する。
提案手法は,様々な合成および実世界のTMベンチマークにおいて,推定速度が大幅に向上した現状のネットワークを超越した手法である。
論文 参考訳(メタデータ) (2025-04-03T15:33:18Z) - Parallel Sequence Modeling via Generalized Spatial Propagation Network [80.66202109995726]
Generalized Spatial Propagation Network (GSPN)は、2次元空間構造を本質的にキャプチャする最適化された視覚タスクのための新しいアテンションメカニズムである。
GSPNは、空間的コヒーレントな画像データを直接操作し、ラインスキャンアプローチを通じて高密度なペアワイズ接続を形成することにより、制限を克服する。
GSPNは、ImageNet分類、クラス誘導画像生成、テキスト・ツー・イメージ生成などの視覚タスクにおいて、より優れた空間忠実性と最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-01-21T18:56:19Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Dual Hyperspectral Mamba for Efficient Spectral Compressive Imaging [102.35787741640749]
本稿では,グローバルな長距離依存関係と局所的コンテキストの両方を探索し,効率的なHSI再構成を実現するために,DHM(Dual Hyperspectral Mamba)を提案する。
具体的には、DHMは複数の双対超スペクトルS4ブロック(DHSB)から構成され、元のHSIを復元する。
論文 参考訳(メタデータ) (2024-06-01T14:14:40Z) - Global-to-Local Modeling for Video-based 3D Human Pose and Shape
Estimation [53.04781510348416]
フレーム内精度とフレーム間スムーズさにより,映像に基づく3次元人間のポーズと形状推定を評価する。
エンドツーエンドフレームワークGLoT(Global-to-Local Transformer)における長期的・短期的相関のモデル化を構造的に分離することを提案する。
我々のGLoTは、一般的なベンチマーク(3DPW、MPI-INF-3DHP、Human3.6M)において、最も低いモデルパラメータを持つ従来の最先端の手法を上回る。
論文 参考訳(メタデータ) (2023-03-26T14:57:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。