論文の概要: ECP-Mamba: An Efficient Multi-scale Self-supervised Contrastive Learning Method with State Space Model for PolSAR Image Classification
- arxiv url: http://arxiv.org/abs/2506.01040v1
- Date: Sun, 01 Jun 2025 14:52:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.905206
- Title: ECP-Mamba: An Efficient Multi-scale Self-supervised Contrastive Learning Method with State Space Model for PolSAR Image Classification
- Title(参考訳): ECP-Mamba: PolSAR画像分類のための状態空間モデルを用いた効率的なマルチスケール自己教師型コントラスト学習手法
- Authors: Zuzheng Kuang, Haixia Bi, Chen Xu, Jian Sun,
- Abstract要約: 本稿では,マルチスケールの自己教師型コントラスト学習と状態空間モデル(SSM)のバックボーンを組み合わせた効率的なフレームワークであるECP-Mambaを提案する。
Flevoland 1989データセットでは、ECP-Mambaは99.70%、平均精度99.64%、Kappa係数99.62e-2で最先端のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 42.02105017671516
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, polarimetric synthetic aperture radar (PolSAR) image classification has been greatly promoted by deep neural networks. However,current deep learning-based PolSAR classification methods encounter difficulties due to its dependence on extensive labeled data and the computational inefficiency of architectures like Transformers. This paper presents ECP-Mamba, an efficient framework integrating multi-scale self-supervised contrastive learning with a state space model (SSM) backbone. Specifically, ECP-Mamba addresses annotation scarcity through a multi-scale predictive pretext task based on local-to-global feature correspondences, which uses a simplified self-distillation paradigm without negative sample pairs. To enhance computational efficiency,the Mamba architecture (a selective SSM) is first tailored for pixel-wise PolSAR classification task by designing a spiral scan strategy. This strategy prioritizes causally relevant features near the central pixel, leveraging the localized nature of pixel-wise classification tasks. Additionally, the lightweight Cross Mamba module is proposed to facilitates complementary multi-scale feature interaction with minimal overhead. Extensive experiments across four benchmark datasets demonstrate ECP-Mamba's effectiveness in balancing high accuracy with resource efficiency. On the Flevoland 1989 dataset, ECP-Mamba achieves state-of-the-art performance with an overall accuracy of 99.70%, average accuracy of 99.64% and Kappa coefficient of 99.62e-2. Our code will be available at https://github.com/HaixiaBi1982/ECP_Mamba.
- Abstract(参考訳): 近年,深層ニューラルネットワークにより偏光合成開口レーダ(PolSAR)画像分類が大幅に促進されている。
しかし、近年のディープラーニングに基づくPolSAR分類手法は、広範囲なラベル付きデータとトランスフォーマーのようなアーキテクチャの計算非効率性に依存しているため、困難に直面している。
本稿では,マルチスケールの自己教師型コントラスト学習と状態空間モデル(SSM)のバックボーンを組み合わせた効率的なフレームワークであるECP-Mambaを提案する。
具体的には、ECP-Mambaは、負のサンプル対を持たない簡易な自己蒸留パラダイムを用いて、局所的-言語的特徴対応に基づくマルチスケールの予測前文タスクを通じて、アノテーションの不足に対処する。
Mambaアーキテクチャ(選択SSM)は、まず、スパイラルスキャン戦略を設計することで、ピクセルワイズPolSAR分類タスク用に調整される。
この戦略は、中心画素近傍で因果関係のある特徴を優先し、画素単位の分類タスクの局所的な性質を活用する。
さらに、軽量なCross Mambaモジュールは、最小限のオーバーヘッドで補完的なマルチスケール機能インタラクションを容易にするために提案されている。
4つのベンチマークデータセットにわたる大規模な実験は、ECP-Mambaが高い精度とリソース効率のバランスをとることの有効性を示している。
Flevoland 1989データセットでは、ECP-Mambaは99.70%、平均精度99.64%、Kappa係数99.62e-2で最先端のパフォーマンスを達成した。
私たちのコードはhttps://github.com/HaixiaBi 1982/ECP_Mamba.comで公開されます。
関連論文リスト
- RD-UIE: Relation-Driven State Space Modeling for Underwater Image Enhancement [59.364418120895]
水中画像強調(UIE)は、海洋視覚応用のための重要な前処理ステップである。
実効UIE(RD-UIE)のための新しい関係駆動型マンバフレームワークを開発した。
水中強化ベンチマークの実験では、RD-UIEは最先端のアプローチであるWMambaよりも優れていた。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - From Pixels to Gigapixels: Bridging Local Inductive Bias and Long-Range Dependencies with Pixel-Mamba [16.19372261506739]
ギガピクセルWSIを効率的に扱うように設計された新しいディープラーニングアーキテクチャであるPixel-Mambaを紹介する。
Pixel-Mambaは、畳み込みニューラルネットワークに似たトークンを徐々に拡大することで、局所的な誘導バイアスを取り入れている。
実験では、エンドツーエンドのWSI分析のための強力で効率的なフレームワークとして、Pixel-Mambaの有効性を示す。
論文 参考訳(メタデータ) (2024-12-21T17:45:27Z) - LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - CATSNet: a context-aware network for Height Estimation in a Forested Area based on Pol-TomoSAR data [4.9793121278328]
この研究は、CATSNetというコンテキスト対応のディープラーニングベースのソリューションを定義している。
畳み込みニューラルネットワークは、パッチベースの情報を活用し、単一のピクセルに注目するのではなく、近隣から特徴を抽出すると考えられる。
実験結果から,複数基線(MB)のTtomoSARデータ内のコンテキスト情報を活用することで,従来の手法を超越した性能と能力の両面で,顕著な優位性を示した。
論文 参考訳(メタデータ) (2024-03-29T16:27:40Z) - MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection [72.46396769642787]
ネスト構造であるMamba-in-Mamba(MiM-ISTD)を開発した。
MiM-ISTDはSOTA法より8倍高速で、2048×2048$のイメージでテストすると、GPUメモリ使用率を62.2$%削減する。
論文 参考訳(メタデータ) (2024-03-04T15:57:29Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Efficient Context Integration through Factorized Pyramidal Learning for
Ultra-Lightweight Semantic Segmentation [1.0499611180329804]
本稿では,FPL(Facterized Pyramidal Learning)モジュールを提案する。
空間ピラミッドを2つのステージに分解し,モジュール内での簡易かつ効率的な特徴融合により,悪名高いチェッカーボード効果を解決する。
FPLモジュールとFIRユニットをベースとしたFPLNetと呼ばれる超軽量リアルタイムネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T05:34:51Z) - Classification of Polarimetric SAR Images Using Compact Convolutional
Neural Networks [24.553598498985796]
PolSAR画像の分類には,新しい,体系的な分類フレームワークが提案されている。
スライドウインドウ分類手法を用いたCNNのコンパクトで適応的な実装に基づいている。
提案手法は深層CNNよりも小さいウィンドウサイズで分類できる。
論文 参考訳(メタデータ) (2020-11-10T17:09:11Z) - Hybrid Multiple Attention Network for Semantic Segmentation in Aerial
Images [24.35779077001839]
グローバルな相関関係を適応的に捉えるために,Hybrid Multiple Attention Network (HMANet) という新しいアテンションベースのフレームワークを提案する。
本稿では,機能的冗長性を低減し,自己注意機構の効率を向上させるため,単純で効果的な領域シャッフルアテンション(RSA)モジュールを提案する。
論文 参考訳(メタデータ) (2020-01-09T07:47:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。