論文の概要: GRAD-Former: Gated Robust Attention-based Differential Transformer for Change Detection
- arxiv url: http://arxiv.org/abs/2603.01161v1
- Date: Sun, 01 Mar 2026 15:56:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.543221
- Title: GRAD-Former: Gated Robust Attention-based Differential Transformer for Change Detection
- Title(参考訳): GRAD-Former:変更検出のためのGated Robust Attention-based Differential Transformer
- Authors: Durgesh Ameta, Ujjwal Mishra, Praful Hambarde, Amit Shukla,
- Abstract要約: リモートセンシングにおける変化検出(CD)は、異なるタイミングで撮影された衛星画像間の意味的差異を特定することを目的としている。
従来の変換器ベースの手法は、超高解像度(VHR)衛星画像に適用する場合、二次計算の複雑さに悩まされる。
GRAD-Formerは、モデルサイズを小さくすることで効率を保ちながら文脈理解を高める新しいフレームワークである。
- 参考スコア(独自算出の注目度): 0.7865560760233441
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Change detection (CD) in remote sensing aims to identify semantic differences between satellite images captured at different times. While deep learning has significantly advanced this field, existing approaches based on convolutional neural networks (CNNs), transformers and Selective State Space Models (SSMs) still struggle to precisely delineate change regions. In particular, traditional transformer-based methods suffer from quadratic computational complexity when applied to very high-resolution (VHR) satellite images and often perform poorly with limited training data, leading to under-utilization of the rich spatial information available in VHR imagery. We present GRAD-Former, a novel framework that enhances contextual understanding while maintaining efficiency through reduced model size. The proposed framework consists of a novel encoder with Adaptive Feature Relevance and Refinement (AFRAR) module, fusion and decoder blocks. AFRAR integrates global-local contextual awareness through two proposed components: the Selective Embedding Amplification (SEA) module and the Global-Local Feature Refinement (GLFR) module. SEA and GLFR leverage gating mechanisms and differential attention, respectively, which generates multiple softmax heaps to capture important features while minimizing the captured irreverent features. Multiple experiments across three challenging CD datasets (LEVIR-CD, CDD, DSIFN-CD) demonstrate GRAD-Former's superior performance compared to existing approaches. Notably, GRAD-Former outperforms the current state-of-the-art models across all the metrics and all the datasets while using fewer parameters. Our framework establishes a new benchmark for remote sensing change detection performance. Our code will be released at: https://github.com/Ujjwal238/GRAD-Former
- Abstract(参考訳): リモートセンシングにおける変化検出(CD)は、異なるタイミングで撮影された衛星画像間の意味的差異を特定することを目的としている。
ディープラーニングはこの分野で大きく進歩しているが、畳み込みニューラルネットワーク(CNN)、トランスフォーマー、選択状態空間モデル(SSM)に基づく既存のアプローチは、変化領域を正確に定義するのに依然として苦労している。
特に、従来のトランスフォーマーベースの手法は、非常に高解像度(VHR)の衛星画像に適用すると2次計算の複雑さに悩まされ、限られた訓練データではしばしば性能が悪くなり、VHR画像で利用可能な豊富な空間情報の未利用に繋がる。
GRAD-Formerは、モデルサイズを小さくすることで効率を保ちながら文脈理解を高める新しいフレームワークである。
提案するフレームワークは、Adaptive Feature Relevance and Refinement (AFRAR)モジュール、フュージョンおよびデコーダブロックを備えた新しいエンコーダで構成されている。
AFRARは、Selective Embedding Amplification (SEA)モジュールとGlobal-Local Feature Refinement (GLFR)モジュールという2つの提案されたコンポーネントを通じて、グローバルなコンテキスト認識を統合している。
SEAとGLFRは、それぞれゲーティング機構と差分アテンションを活用し、複数のソフトマックスヒープを生成して重要な特徴を捉え、捕獲された不適切な特徴を最小限に抑える。
3つの挑戦CDデータセット(LEVIR-CD, CDD, DSIFN-CD)にまたがる複数の実験により、GRAD-Formerは既存の手法に比べて優れた性能を示した。
特に、GRAD-Formerは、パラメータを減らしながら、すべてのメトリクスとすべてのデータセットで現在の最先端モデルよりも優れています。
我々のフレームワークは、リモートセンシングによる変化検出性能の新たなベンチマークを確立する。
私たちのコードは、https://github.com/Ujjwal238/GRAD-Formerでリリースされます。
関連論文リスト
- LG-CD: Enhancing Language-Guided Change Detection through SAM2 Adaptation [9.324344835427858]
我々はLG-CD(Language-Guided Change Detection Model)を提案する。
このモデルは、自然言語のプロンプトを利用して、ネットワークの関心領域への注意を向ける。
3つのデータセットに対する実験により、LG-CDは最先端の変更検出方法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-09-26T05:30:11Z) - GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - SAMamba: Adaptive State Space Modeling with Hierarchical Vision for Infrared Small Target Detection [12.964308630328688]
赤外線小目標検出(ISTD)は、軍事・海上・早期警戒用途における長距離監視に不可欠である。
ISTDは画像の0.15%未満のターゲットと複雑な背景との識別性が低いターゲットによって挑戦されている。
本稿では,SAM2の階層的特徴学習とMambaの選択的シーケンスモデリングを統合した新しいフレームワークSAMambaを提案する。
論文 参考訳(メタデータ) (2025-05-29T07:55:23Z) - AuxDet: Auxiliary Metadata Matters for Omni-Domain Infrared Small Target Detection [49.81255045696323]
補助メタデータ駆動型赤外小型ターゲット検出器(AuxDet)について述べる。
AuxDetはメタデータセマンティクスと視覚的特徴を統合し、各サンプルに対する適応表現学習を導く。
挑戦的なWideIRSTD-Fullベンチマークの実験は、AuxDetが一貫して最先端のメソッドより優れていることを示した。
論文 参考訳(メタデータ) (2025-05-21T07:02:05Z) - ARFC-WAHNet: Adaptive Receptive Field Convolution and Wavelet-Attentive Hierarchical Network for Infrared Small Target Detection [2.643590634429843]
ARFC-WAHNetは、赤外線小ターゲット検出のための適応型受容野畳み込みおよびウェーブレット減衰階層ネットワークである。
ARFC-WAHNetは、検出精度とロバスト性の両方において、最近の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2025-05-15T09:44:23Z) - FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.75504192166779]
本稿では,潜時拡散モデルにおける周波数制御について検討する。
本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。
FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文 参考訳(メタデータ) (2025-04-02T22:03:11Z) - Relating CNN-Transformer Fusion Network for Change Detection [23.025190360146635]
RCTNetは、空間的特徴と時間的特徴の両方を利用する早期融合バックボーンを導入した。
実験では、従来のRS画像CD法よりもRCTNetの方が明らかに優れていることを示した。
論文 参考訳(メタデータ) (2024-07-03T14:58:40Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - TransY-Net:Learning Fully Transformer Networks for Change Detection of
Remote Sensing Images [64.63004710817239]
リモートセンシング画像CDのためのトランスフォーマーベース学習フレームワークTransY-Netを提案する。
グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。
提案手法は,4つの光学式および2つのSAR画像CDベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-22T07:42:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。