論文の概要: 2DMCG:2DMambawith Change Flow Guidance for Change Detection in Remote Sensing
- arxiv url: http://arxiv.org/abs/2503.00521v1
- Date: Sat, 01 Mar 2025 14:55:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:19:04.688143
- Title: 2DMCG:2DMambawith Change Flow Guidance for Change Detection in Remote Sensing
- Title(参考訳): 2DMCG:2DMambaanceを用いたリモートセンシングにおける変化検出
- Authors: JunYao Kaung, HongWei Ge,
- Abstract要約: 本稿では、2次元空間情報をキャプチャする能力を高めるビジョンマンバ変種に基づく効率的なフレームワークを提案する。
このフレームワークは、2DMambaエンコーダを使用して、多時間画像からグローバルなコンテキスト空間情報を効果的に学習する。
ベンチマークデータセットの実験は、最先端の手法と比較して、我々のフレームワークの優れた性能を示している。
- 参考スコア(独自算出の注目度): 4.18306618346671
- License:
- Abstract: Remote sensing change detection (CD) has made significant advancements with the adoption of Convolutional Neural Networks (CNNs) and Transformers. While CNNs offer powerful feature extraction, they are constrained by receptive field limitations, and Transformers suffer from quadratic complexity when processing long sequences, restricting scalability. The Mamba architecture provides an appealing alternative, offering linear complexity and high parallelism. However, its inherent 1D processing structure causes a loss of spatial information in 2D vision tasks. This paper addresses this limitation by proposing an efficient framework based on a Vision Mamba variant that enhances its ability to capture 2D spatial information while maintaining the linear complexity characteristic of Mamba. The framework employs a 2DMamba encoder to effectively learn global spatial contextual information from multi-temporal images. For feature fusion, we introduce a 2D scan-based, channel-parallel scanning strategy combined with a spatio-temporal feature fusion method, which adeptly captures both local and global change information, alleviating spatial discontinuity issues during fusion. In the decoding stage, we present a feature change flow-based decoding method that improves the mapping of feature change information from low-resolution to high-resolution feature maps, mitigating feature shift and misalignment. Extensive experiments on benchmark datasets such as LEVIR-CD+ and WHU-CD demonstrate the superior performance of our framework compared to state-of-the-art methods, showcasing the potential of Vision Mamba for efficient and accurate remote sensing change detection.
- Abstract(参考訳): リモートセンシング変化検出(CD)は、畳み込みニューラルネットワーク(CNN)とトランスフォーマーの採用によって大きな進歩を遂げた。
CNNは強力な特徴抽出を提供するが、受容的フィールド制限によって制約され、Transformerは長いシーケンスを処理する際に2次複雑さに悩まされ、スケーラビリティが制限される。
Mambaアーキテクチャは、線形複雑性と高い並列性を提供する魅力的な代替手段を提供する。
しかし、その固有の1次元処理構造は、2次元視覚タスクにおいて空間情報の損失を引き起こす。
本稿では,マンバの線形複雑性特性を維持しつつ,2次元空間情報を捕捉する能力を高めるビジョンマンバ変種に基づく効率的なフレームワークを提案する。
このフレームワークは、2DMambaエンコーダを使用して、多時間画像からグローバルな空間的コンテキスト情報を効果的に学習する。
本研究では,2次元走査型チャネル並列走査法と時空間的特徴融合法を併用して,局所的および大域的変化情報の両方を有効に捕捉し,核融合時の空間的不連続性を緩和する手法を提案する。
復号段階では,低分解能から高分解能までの特徴変化情報のマッピングを改善し,特徴変化の軽減と誤調整を行う特徴変化フローベース復号法を提案する。
LEVIR-CD+やWHU-CDのようなベンチマークデータセットに対する大規模な実験は、最先端の手法と比較して、我々のフレームワークの優れた性能を示し、Vision Mambaの可能性を効率よく正確なリモートセンシング変化検出のために示している。
関連論文リスト
- Detail Matters: Mamba-Inspired Joint Unfolding Network for Snapshot Spectral Compressive Imaging [40.80197280147993]
本研究では,HSI再建の非線形および不適切な特徴を克服するために,マンバインスパイアされたジョイント・アンフォールディング・ネットワーク(MiJUN)を提案する。
本稿では,初期最適化段階への依存を減らすために,高速化された展開ネットワーク方式を提案する。
テンソルモード-$k$展開をMambaネットワークに統合することにより,Mambaによる走査戦略を洗練する。
論文 参考訳(メタデータ) (2025-01-02T13:56:23Z) - STNMamba: Mamba-based Spatial-Temporal Normality Learning for Video Anomaly Detection [48.997518615379995]
ビデオ異常検出(VAD)は、インテリジェントなビデオシステムの可能性から広く研究されている。
CNNやトランスフォーマーをベースとした既存の手法の多くは、依然としてかなりの計算負荷に悩まされている。
空間的時間的正規性の学習を促進するために,STNMambaという軽量で効果的なネットワークを提案する。
論文 参考訳(メタデータ) (2024-12-28T08:49:23Z) - LCD-Net: A Lightweight Remote Sensing Change Detection Network Combining Feature Fusion and Gating Mechanism [6.5655751924536006]
リモートセンシング画像変化検出(RSCD)は動的表面変化の監視に不可欠である。
従来のCNNベースの手法は、高い計算複雑性と大きなパラメータ数に悩まされている。
本稿では,高検出性能を維持しつつ,モデルサイズと計算コストを低減する軽量な変更検出ネットワーク(LCD-Net)を提案する。
論文 参考訳(メタデータ) (2024-10-14T10:33:30Z) - Remote Sensing Image Segmentation Using Vision Mamba and Multi-Scale Multi-Frequency Feature Fusion [9.098711843118629]
本稿では、状態空間モデル(SSM)を導入し、視覚マンバ(CVMH-UNet)に基づく新しいハイブリッドセマンティックセマンティックネットワークを提案する。
本手法は、クロス2Dスキャン(CS2D)を用いて、複数の方向からグローバル情報をフルにキャプチャする、クロス走査型視覚状態空間ブロック(CVSSBlock)を設計する。
ローカル情報取得におけるビジョン・マンバ(VMamba)の制約を克服するために畳み込みニューラルネットワークのブランチを組み込むことにより、このアプローチはグローバル機能とローカル機能の両方の包括的な分析を促進する。
論文 参考訳(メタデータ) (2024-10-08T02:17:38Z) - A Hybrid Transformer-Mamba Network for Single Image Deraining [70.64069487982916]
既存のデラリング変換器では、固定レンジウィンドウやチャネル次元に沿って自己アテンション機構を採用している。
本稿では,多分岐型トランスフォーマー・マンバネットワーク(Transformer-Mamba Network,TransMamba Network,Transformer-Mamba Network)を提案する。
論文 参考訳(メタデータ) (2024-08-31T10:03:19Z) - Relating CNN-Transformer Fusion Network for Change Detection [23.025190360146635]
RCTNetは、空間的特徴と時間的特徴の両方を利用する早期融合バックボーンを導入した。
実験では、従来のRS画像CD法よりもRCTNetの方が明らかに優れていることを示した。
論文 参考訳(メタデータ) (2024-07-03T14:58:40Z) - ChangeBind: A Hybrid Change Encoder for Remote Sensing Change Detection [16.62779899494721]
変化検出(CD)は、異なる時刻スタンプで同じ地理的領域間の意味的変化を検出することを目的とした、リモートセンシング(RS)の基本課題である。
本稿では,バイテンポラルRS画像における意味変化をエンコードする,効果的なSiameseベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-26T17:47:14Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - TransY-Net:Learning Fully Transformer Networks for Change Detection of
Remote Sensing Images [64.63004710817239]
リモートセンシング画像CDのためのトランスフォーマーベース学習フレームワークTransY-Netを提案する。
グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。
提案手法は,4つの光学式および2つのSAR画像CDベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-22T07:42:19Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。