論文の概要: Exploring Non-Local Spatial-Angular Correlations with a Hybrid Mamba-Transformer Framework for Light Field Super-Resolution
- arxiv url: http://arxiv.org/abs/2509.04824v1
- Date: Fri, 05 Sep 2025 05:50:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.490993
- Title: Exploring Non-Local Spatial-Angular Correlations with a Hybrid Mamba-Transformer Framework for Light Field Super-Resolution
- Title(参考訳): 光電場超解像のためのハイブリッドマンバ変圧器を用いた非局所空間角相関の探索
- Authors: Haosong Liu, Xiancheng Zhu, Huanqiang Zeng, Jianqing Zhu, Jiuwen Cao, Junhui Hou,
- Abstract要約: マンバ法は光画像超解像の計算コストと性能を最適化する大きな可能性を示している。
本稿では,より効率的かつ正確な特徴抽出を実現するために,Subspace Simple Mamba Block (SSMB) を設計したSubspace Simple Scanning (Sub-SS) 戦略を提案する。
また,空間角・異質情報の保存における状態空間の制限に対処する二段階モデリング手法を提案する。
- 参考スコア(独自算出の注目度): 68.54692184478462
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, Mamba-based methods, with its advantage in long-range information modeling and linear complexity, have shown great potential in optimizing both computational cost and performance of light field image super-resolution (LFSR). However, current multi-directional scanning strategies lead to inefficient and redundant feature extraction when applied to complex LF data. To overcome this challenge, we propose a Subspace Simple Scanning (Sub-SS) strategy, based on which we design the Subspace Simple Mamba Block (SSMB) to achieve more efficient and precise feature extraction. Furthermore, we propose a dual-stage modeling strategy to address the limitation of state space in preserving spatial-angular and disparity information, thereby enabling a more comprehensive exploration of non-local spatial-angular correlations. Specifically, in stage I, we introduce the Spatial-Angular Residual Subspace Mamba Block (SA-RSMB) for shallow spatial-angular feature extraction; in stage II, we use a dual-branch parallel structure combining the Epipolar Plane Mamba Block (EPMB) and Epipolar Plane Transformer Block (EPTB) for deep epipolar feature refinement. Building upon meticulously designed modules and strategies, we introduce a hybrid Mamba-Transformer framework, termed LFMT. LFMT integrates the strengths of Mamba and Transformer models for LFSR, enabling comprehensive information exploration across spatial, angular, and epipolar-plane domains. Experimental results demonstrate that LFMT significantly outperforms current state-of-the-art methods in LFSR, achieving substantial improvements in performance while maintaining low computational complexity on both real-word and synthetic LF datasets.
- Abstract(参考訳): 近年,長距離情報モデリングと線形複雑性の利点を活かしたマンバ法は,光場画像超解像(LFSR)の計算コストと性能を最適化する大きな可能性を示している。
しかし、現在の多方向走査方式は、複雑なLFデータに適用した場合、非効率で冗長な特徴抽出につながる。
そこで我々は,より効率的かつ正確な特徴抽出を実現するために,Subspace Simple Mamba Block (SSMB) を設計したSubspace Simple Scanning (Sub-SS) 戦略を提案する。
さらに,空間角情報と不均一情報の保存における状態空間の制限に対処する二段階モデリング手法を提案し,非局所的空間角相関のより包括的な探索を可能にする。
特に,第1段では,浅部空間角特徴抽出のための空間角残留部分空間マンバブロック (SA-RSMB) を導入し,第2段では,エピポーラ平面マンバブロック (EPMB) とエピポーラ平面トランスフォーマーブロック (EPTB) を組み合わせた二重分岐並列構造を用いて,深部地極特徴抽出を行う。
モジュールと戦略を巧みに設計し、LFMTと呼ばれるハイブリッドなMamba-Transformerフレームワークを導入する。
LFMTは、LFSRのためのMambaモデルとTransformerモデルの強みを統合し、空間、角、エピポーラ面領域にわたる包括的な情報探索を可能にする。
実験結果から、LFMTはLFSRにおける現在の最先端手法よりも大幅に優れており、実単語および合成LFデータセットの計算複雑性を低く保ちながら、性能が大幅に向上していることが明らかとなった。
関連論文リスト
- MVNet: Hyperspectral Remote Sensing Image Classification Based on Hybrid Mamba-Transformer Vision Backbone Architecture [12.168520751389622]
ハイパースペクトル画像(HSI)分類は、高次元データ、限られたトレーニングサンプル、スペクトル冗長性といった課題に直面している。
本稿では,3D-CNNの局所特徴抽出,Transformerのグローバルモデリング,Mambaの線形シーケンスモデリング機能を統合した新しいMVNetネットワークアーキテクチャを提案する。
IN、UP、KSCデータセットでは、MVNetは分類精度と計算効率の両方で主流のハイパースペクトル画像分類法より優れている。
論文 参考訳(メタデータ) (2025-07-06T14:52:26Z) - STNMamba: Mamba-based Spatial-Temporal Normality Learning for Video Anomaly Detection [48.997518615379995]
ビデオ異常検出(VAD)は、インテリジェントなビデオシステムの可能性から広く研究されている。
CNNやトランスフォーマーをベースとした既存の手法の多くは、依然としてかなりの計算負荷に悩まされている。
空間的時間的正規性の学習を促進するために,STNMambaという軽量で効果的なネットワークを提案する。
論文 参考訳(メタデータ) (2024-12-28T08:49:23Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Mamba-based Light Field Super-Resolution with Efficient Subspace Scanning [48.99361249764921]
4次元光場(LF)超解像において,トランスフォーマー法は優れた性能を示した。
しかし、その二次的な複雑さは、高解像度の4D入力の効率的な処理を妨げる。
我々は,効率的な部分空間走査戦略を設計し,マンバをベースとした光場超解法 MLFSR を提案する。
論文 参考訳(メタデータ) (2024-06-23T11:28:08Z) - LFMamba: Light Field Image Super-Resolution with State Space Model [28.426889157353028]
LFMambaと呼ばれる光フィールド画像の超解像のためのSSMネットワークを提案する。
LFベンチマーク実験の結果, LFMambaの性能は良好であった。
LFMambaは、状態空間モデルによるLFの効果的な表現学習に光を当てていると期待している。
論文 参考訳(メタデータ) (2024-06-18T10:13:19Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z) - Beyond Subspace Isolation: Many-to-Many Transformer for Light Field Image Super-resolution [4.83071396703167]
本稿では,光フィールド画像超解像処理のための新しいM2MTを提案する。
M2MTは、自己認識機構を実行する前に、空間部分空間内の角情報を集約する。
光フィールド画像内の全てのサブアパーチャ画像全体への完全なアクセスを可能にする。
論文 参考訳(メタデータ) (2024-01-01T12:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。