論文の概要: SCA-Net: Spatial-Contextual Aggregation Network for Enhanced Small Building and Road Change Detection
- arxiv url: http://arxiv.org/abs/2602.09529v1
- Date: Tue, 10 Feb 2026 08:38:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.453156
- Title: SCA-Net: Spatial-Contextual Aggregation Network for Enhanced Small Building and Road Change Detection
- Title(参考訳): SCA-Net: 小型建物の拡張と道路変更検出のための空間環境アグリゲーションネットワーク
- Authors: Emad Gholibeigi, Abbas Koochari, Azadeh ZamaniFar,
- Abstract要約: 本稿では,両時間画像の正確な構築と道路変更検出のために,Change-Agentフレームワーク上に構築された拡張アーキテクチャであるSCA-Netを提案する。
本モデルでは, マルチスケール変更分析のための新しい差分ピラミッドブロック, 形状認識と高分解能拡張ブロックを組み合わせた適応型マルチスケール処理モジュール, 共同処理のための多レベルアテンション機構(PPM, CSAGate)を取り入れた。
LEVIR-CDとLEVIR-MCIデータセットの総合評価は、SCA-NetがChange-Agentや他の状態よりも優れていることを示している。
- 参考スコア(独自算出の注目度): 3.4282767550229316
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automated change detection in remote sensing imagery is critical for urban management, environmental monitoring, and disaster assessment. While deep learning models have advanced this field, they often struggle with challenges like low sensitivity to small objects and high computational costs. This paper presents SCA-Net, an enhanced architecture built upon the Change-Agent framework for precise building and road change detection in bi-temporal images. Our model incorporates several key innovations: a novel Difference Pyramid Block for multi-scale change analysis, an Adaptive Multi-scale Processing module combining shape-aware and high-resolution enhancement blocks, and multi-level attention mechanisms (PPM and CSAGate) for joint contextual and detail processing. Furthermore, a dynamic composite loss function and a four-phase training strategy are introduced to stabilize training and accelerate convergence. Comprehensive evaluations on the LEVIR-CD and LEVIR-MCI datasets demonstrate SCA-Net's superior performance over Change-Agent and other state-of-the-art methods. Our approach achieves a significant 2.64% improvement in mean Intersection over Union (mIoU) on LEVIR-MCI and a remarkable 57.9% increase in IoU for small buildings, while reducing the training time by 61%. This work provides an efficient, accurate, and robust solution for practical change detection applications.
- Abstract(参考訳): リモートセンシング画像における自動変化検出は,都市管理,環境モニタリング,災害評価において重要である。
ディープラーニングモデルはこの分野を進歩させているが、小さなオブジェクトに対する感度の低さや高い計算コストといった課題に悩まされることが多い。
本稿では,両時間画像の正確な構築と道路変更検出のために,Change-Agentフレームワーク上に構築された拡張アーキテクチャであるSCA-Netを提案する。
本モデルでは, マルチスケール変更分析のための新しい差分ピラミッドブロック, 形状認識と高分解能拡張ブロックを組み合わせた適応型マルチスケール処理モジュール, 共同処理のための多レベルアテンション機構(PPM, CSAGate)を取り入れた。
さらに、動的複合損失関数と4相トレーニング戦略を導入し、トレーニングを安定させ、収束を加速する。
LEVIR-CDとLEVIR-MCIデータセットに関する総合的な評価は、SCA-NetがChange-Agentや他の最先端手法よりも優れていることを示している。
LEVIR-MCIにおけるMIoU平均区間(mIoU平均区間)の2.64%の大幅な改善と、小型建築物におけるIoUの57.9%の顕著な増加を実現し、トレーニング時間を61%短縮した。
この作業は、実用的な変更検出アプリケーションに対して、効率的で正確で堅牢なソリューションを提供する。
関連論文リスト
- RT-DETRv4: Painlessly Furthering Real-Time Object Detection with Vision Foundation Models [48.91205564876609]
軽量物体検出器の高効率化を目的とした,コスト効率・高適合性蒸留フレームワークを提案する。
当社のアプローチは、さまざまなDETRベースのモデルに対して、目立って一貫したパフォーマンス向上を実現しています。
我々の新しいモデルファミリーRT-DETRv4はCOCOの最先端結果を達成し、APスコアは49.7/53.5/55.4/57.0で、対応する速度は273/169/124/78 FPSである。
論文 参考訳(メタデータ) (2025-10-29T08:13:17Z) - Rethinking the Role of Dynamic Sparse Training for Scalable Deep Reinforcement Learning [58.533203990515034]
ニューラルネットワークのスケーリングは機械学習における画期的な進歩をもたらしたが、このパラダイムは深層強化学習(DRL)では失敗している。
我々は、動的スパーストレーニング戦略が、アーキテクチャの改善によって確立された主要なスケーラビリティ基盤を補完するモジュール固有の利点を提供することを示す。
アーキテクチャ改善の利点を生かした実践的なフレームワークであるModule-Specific Training (MST) にこれらの知見を精査し、アルゴリズムの修正なしに様々なRLアルゴリズムをまたいだ大幅なスケーラビリティ向上を示す。
論文 参考訳(メタデータ) (2025-10-14T03:03:08Z) - Pushing Trade-Off Boundaries: Compact yet Effective Remote Sensing Change Detection [5.686242146196292]
FlickCDは高速なフリックで素晴らしい結果が得られることを意味し、パフォーマンスとリソースのトレードオフの境界を押し進めます。
FlickCDは、最先端(SOTA)のパフォーマンスを達成しつつ、計算とストレージのオーバーヘッドを1桁以上削減する。
論文 参考訳(メタデータ) (2025-06-26T09:06:52Z) - Efficient Transformer for High Resolution Image Motion Deblurring [0.0]
本稿では,高分解能イメージモーションデブロアに対するRestormerアーキテクチャの総合的研究と改良について述べる。
モデル複雑性を18.4%削減し、最適化された注意機構によって性能を維持または改善するアーキテクチャ変更を導入する。
以上の結果から, 思考的アーキテクチャの単純化と学習戦略の強化が組み合わさって, より効率的かつ等しく機能的な作業モデルが得られることが示唆された。
論文 参考訳(メタデータ) (2025-01-30T14:58:33Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - HANet: A Hierarchical Attention Network for Change Detection With Bitemporal Very-High-Resolution Remote Sensing Images [6.890268321645873]
本研究では,変化情報の追加を含まないことに基づく,段階的前景バランスサンプリング戦略を提案する。
この戦略は、初期のトレーニングプロセス中に変更したピクセルの特徴を正確に学習するのに役立つ。
また,階層型注意ネットワーク(HANet)を設計し,マルチスケール機能の統合と詳細機能の改良を図る。
論文 参考訳(メタデータ) (2024-04-14T08:01:27Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。