論文の概要: MambaOutRS: A Hybrid CNN-Fourier Architecture for Remote Sensing Image Classification
- arxiv url: http://arxiv.org/abs/2506.19561v1
- Date: Tue, 24 Jun 2025 12:20:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.620002
- Title: MambaOutRS: A Hybrid CNN-Fourier Architecture for Remote Sensing Image Classification
- Title(参考訳): MambaOutRS:リモートセンシング画像分類のためのハイブリッドCNN-Fourierアーキテクチャ
- Authors: Minjong Cheon, Changbae Mun,
- Abstract要約: リモートセンシング画像分類のための新しいハイブリッド畳み込みアーキテクチャであるMambaOutRSを紹介する。
MambaOutRSは、局所的な特徴抽出のためにスタック化されたGated CNNブロック上に構築され、新しいFourier Filter Gate (FFG)モジュールが導入されている。
- 参考スコア(独自算出の注目度): 4.14360329494344
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in deep learning for vision tasks have seen the rise of State Space Models (SSMs) like Mamba, celebrated for their linear scalability. However, their adaptation to 2D visual data often necessitates complex modifications that may diminish efficiency. In this paper, we introduce MambaOutRS, a novel hybrid convolutional architecture for remote sensing image classification that re-evaluates the necessity of recurrent SSMs. MambaOutRS builds upon stacked Gated CNN blocks for local feature extraction and introduces a novel Fourier Filter Gate (FFG) module that operates in the frequency domain to capture global contextual information efficiently. Our architecture employs a four-stage hierarchical design and was extensively evaluated on challenging remote sensing datasets: UC Merced, AID, NWPU-RESISC45, and EuroSAT. MambaOutRS consistently achieved state-of-the-art (SOTA) performance across these benchmarks. Notably, our MambaOutRS-t variant (24.0M parameters) attained the highest F1-scores of 98.41\% on UC Merced and 95.99\% on AID, significantly outperforming existing baselines, including larger transformer models and Mamba-based architectures, despite using considerably fewer parameters. An ablation study conclusively demonstrates the critical role of the Fourier Filter Gate in enhancing the model's ability to capture global spatial patterns, leading to robust and accurate classification. These results strongly suggest that the complexities of recurrent SSMs can be effectively superseded by a judicious combination of gated convolutions for spatial mixing and frequency-based gates for spectral global context. Thus, MambaOutRS provides a compelling and efficient paradigm for developing high-performance deep learning models in remote sensing and other vision domains, particularly where computational efficiency is paramount.
- Abstract(参考訳): ビジョンタスクのためのディープラーニングの最近の進歩は、Mambaのようなステートスペースモデル(SSM)の台頭を目の当たりにしている。
しかし、2次元の視覚データへの適応は、効率を低下させるような複雑な修正を必要とすることが多い。
本稿では、リモートセンシング画像分類のための新しいハイブリッド畳み込みアーキテクチャであるMambaOutRSを紹介し、再帰的なSSMの必要性を再評価する。
MambaOutRSは、局所的な特徴抽出のために積み重ねられたGated CNNブロックの上に構築され、グローバルなコンテキスト情報を効率的にキャプチャするために周波数領域で動作する新しいフーリエフィルタゲート(FFG)モジュールを導入している。
我々のアーキテクチャは4段階の階層設計を採用し、UC Merced、AID、NWPU-RESISC45、EuroSATといったリモートセンシングデータセットに対して広範囲に評価された。
MambaOutRSはこれらのベンチマークで常に最先端(SOTA)のパフォーマンスを達成した。
特に、我々のMambaOutRS-t 変種 (24.0M パラメータ) は UC Merced で98.41\%、AIDで95.99\% の最高スコアに達し、大きなトランスフォーマーモデルやMamba ベースのアーキテクチャを含む既存のベースラインを著しく上回った。
アブレーション研究は、大域的な空間パターンを捕捉するモデルの能力を高める上で、フーリエフィルタゲートが重要な役割を担っていることを決定的に示し、堅牢で正確な分類に繋がった。
これらの結果は、空間混合のためのゲート畳み込みとスペクトル大域文脈のための周波数ベースゲートを併用することにより、繰り返しSSMの複雑さを効果的に置き換えることができることを強く示唆している。
したがって、MambaOutRSは、特に計算効率が最重要であるリモートセンシングやその他の視覚領域において、高性能なディープラーニングモデルを開発するための、魅力的で効率的なパラダイムを提供する。
関連論文リスト
- RD-UIE: Relation-Driven State Space Modeling for Underwater Image Enhancement [59.364418120895]
水中画像強調(UIE)は、海洋視覚応用のための重要な前処理ステップである。
実効UIE(RD-UIE)のための新しい関係駆動型マンバフレームワークを開発した。
水中強化ベンチマークの実験では、RD-UIEは最先端のアプローチであるWMambaよりも優れていた。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - IRSRMamba: Infrared Image Super-Resolution via Mamba-based Wavelet Transform Feature Modulation Model [7.842507196763463]
IRSRMambaはマルチスケール適応のためのウェーブレット変換特徴変調を統合する新しいフレームワークである。
IRSRMambaはPSNR、SSIM、知覚品質において最先端の手法より優れている。
この研究は、高忠実度赤外線画像強調のための有望な方向として、Mambaベースのアーキテクチャを確立する。
論文 参考訳(メタデータ) (2024-05-16T07:49:24Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z) - MambaUIE&SR: Unraveling the Ocean's Secrets with Only 2.8 GFLOPs [1.7648680700685022]
水中画像強調(UIE)技術は,光吸収・散乱による水中画像劣化問題に対処することを目的としている。
近年、畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの手法が広く研究されている。
MambaUIEは、グローバルおよびローカル情報を効率的に合成することができ、非常に少数のパラメータを高い精度で保持する。
論文 参考訳(メタデータ) (2024-04-22T05:12:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。