論文の概要: Towards Remote Sensing Change Detection with Neural Memory
- arxiv url: http://arxiv.org/abs/2602.10491v1
- Date: Wed, 11 Feb 2026 03:50:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.443091
- Title: Towards Remote Sensing Change Detection with Neural Memory
- Title(参考訳): ニューラルメモリを用いたリモートセンシング変化検出に向けて
- Authors: Zhenyu Yang, Gensheng Pei, Yazhou Yao, Tianfei Zhou, Lizhong Ding, Fumin Shen,
- Abstract要約: ChangeTitansは、リモートセンシングによる変更検出のためのTitansベースのフレームワークである。
まず、ニューラルネットワークと局所的な注意をセグメント化して統合するVTitansを提案する。
次に,階層型VTitans-Adapterを提案する。
第3に、2ストリーム融合モジュールであるTS-CBAMを導入し、擬似変化を抑制し、検出精度を高める。
- 参考スコア(独自算出の注目度): 61.39582645714727
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing change detection is essential for environmental monitoring, urban planning, and related applications. However, current methods often struggle to capture long-range dependencies while maintaining computational efficiency. Although Transformers can effectively model global context, their quadratic complexity poses scalability challenges, and existing linear attention approaches frequently fail to capture intricate spatiotemporal relationships. Drawing inspiration from the recent success of Titans in language tasks, we present ChangeTitans, the Titans-based framework for remote sensing change detection. Specifically, we propose VTitans, the first Titans-based vision backbone that integrates neural memory with segmented local attention, thereby capturing long-range dependencies while mitigating computational overhead. Next, we present a hierarchical VTitans-Adapter to refine multi-scale features across different network layers. Finally, we introduce TS-CBAM, a two-stream fusion module leveraging cross-temporal attention to suppress pseudo-changes and enhance detection accuracy. Experimental evaluations on four benchmark datasets (LEVIR-CD, WHU-CD, LEVIR-CD+, and SYSU-CD) demonstrate that ChangeTitans achieves state-of-the-art results, attaining \textbf{84.36\%} IoU and \textbf{91.52\%} F1-score on LEVIR-CD, while remaining computationally competitive.
- Abstract(参考訳): リモートセンシングによる変化検出は, 環境モニタリング, 都市計画, 関連アプリケーションに不可欠である。
しかし、現在の手法は計算効率を保ちながら長距離依存を捉えるのに苦労することが多い。
トランスフォーマーはグローバルなコンテキストを効果的にモデル化できるが、その二次的な複雑さはスケーラビリティの問題を引き起こし、既存の線形アテンションアプローチは複雑な時空間関係を捉えるのに失敗する。
言語タスクにおける最近のTitansの成功からインスピレーションを得て,Titansベースのリモートセンシング変更検出フレームワークであるChangeTitansを紹介した。
具体的には、Titansをベースとした最初のビジョンバックボーンであるVTitansを提案する。これは、ニューラルメモリとセグメント化されたローカルアテンションを統合し、計算オーバーヘッドを軽減しつつ、長距離依存をキャプチャする。
次に,階層型VTitans-Adapterを提案する。
最後に,2ストリーム融合モジュールであるTS-CBAMを導入し,擬似変化の抑制と検出精度の向上を図る。
4つのベンチマークデータセット (LEVIR-CD, WHU-CD, LEVIR-CD+, SYSU-CD) の実験的評価により、ChangeTitans は LEVIR-CD 上で \textbf{84.36\%} IoU と \textbf{91.52\%} F1-score を獲得しながら、計算上の競争力を維持しながら、最先端の結果を達成することを示した。
関連論文リスト
- RemoteVAR: Autoregressive Visual Modeling for Remote Sensing Change Detection [52.32112533846212]
リモートセンシングによる変化検出は、環境モニタリングや災害評価といった応用の中心である。
視覚的自己回帰モデルは最近、印象的な画像生成能力を示しているが、画素レベルの識別タスクへの採用は、制御性の弱さ、最適下層予測性能、露出バイアスによって制限されている。
本稿では,これらの制約に対処する新しいVARベースの変化検出フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-17T03:50:00Z) - MambaTAD: When State-Space Models Meet Long-Range Temporal Action Detection [94.12444452690329]
本稿では,長距離モデリングとグローバル機能検出機能を導入した新しい状態空間TADモデルであるMambaTADを提案する。
MambaTADは、複数の公開ベンチマークで一貫して優れたTAD性能を達成する。
論文 参考訳(メタデータ) (2025-11-22T06:04:29Z) - Morphing Through Time: Diffusion-Based Bridging of Temporal Gaps for Robust Alignment in Change Detection [51.56484100374058]
既存の変更検出ネットワークを変更することなく空間的・時間的ロバスト性を改善するモジュールパイプラインを導入する。
拡散モジュールは、大きな外観ギャップをブリッジする中間変形フレームを合成し、RoMaは段階的に対応を推定できる。
LEVIR-CD、WHU-CD、DSIFN-CDの実験は、登録精度と下流変化検出の両方において一貫した利得を示した。
論文 参考訳(メタデータ) (2025-11-11T08:40:28Z) - Efficient Remote Sensing Change Detection with Change State Space Models [4.698129958118586]
変化状態空間モデルは、バイテンポラル画像間の関連する変化に着目して、変化検出のために特別に設計されている。
提案したモデルは3つのベンチマークデータセットを通じて評価され、計算複雑性のごく一部で、ConvNets、ViTs、Mambaベースのモデルを上回った。
論文 参考訳(メタデータ) (2025-04-15T11:25:10Z) - 2DMCG:2DMambawith Change Flow Guidance for Change Detection in Remote Sensing [4.18306618346671]
本稿では、2次元空間情報をキャプチャする能力を高めるビジョンマンバ変種に基づく効率的なフレームワークを提案する。
このフレームワークは、2DMambaエンコーダを使用して、多時間画像からグローバルなコンテキスト空間情報を効果的に学習する。
ベンチマークデータセットの実験は、最先端の手法と比較して、我々のフレームワークの優れた性能を示している。
論文 参考訳(メタデータ) (2025-03-01T14:55:13Z) - Relating CNN-Transformer Fusion Network for Change Detection [23.025190360146635]
RCTNetは、空間的特徴と時間的特徴の両方を利用する早期融合バックボーンを導入した。
実験では、従来のRS画像CD法よりもRCTNetの方が明らかに優れていることを示した。
論文 参考訳(メタデータ) (2024-07-03T14:58:40Z) - ChangeBind: A Hybrid Change Encoder for Remote Sensing Change Detection [16.62779899494721]
変化検出(CD)は、異なる時刻スタンプで同じ地理的領域間の意味的変化を検出することを目的とした、リモートセンシング(RS)の基本課題である。
本稿では,バイテンポラルRS画像における意味変化をエンコードする,効果的なSiameseベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-26T17:47:14Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - Dual Swin-Transformer based Mutual Interactive Network for RGB-D Salient
Object Detection [67.33924278729903]
本研究では,Dual Swin-Transformerを用いたMutual Interactive Networkを提案する。
視覚入力における長距離依存をモデル化するために,RGBと奥行きモードの両方の機能抽出器としてSwin-Transformerを採用している。
5つの標準RGB-D SODベンチマークデータセットに関する総合的な実験は、提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2022-06-07T08:35:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。