論文の概要: Pushing Trade-Off Boundaries: Compact yet Effective Remote Sensing Change Detection
- arxiv url: http://arxiv.org/abs/2506.21109v1
- Date: Thu, 26 Jun 2025 09:06:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.035871
- Title: Pushing Trade-Off Boundaries: Compact yet Effective Remote Sensing Change Detection
- Title(参考訳): 貿易境界のプッシュ:コンパクトで効果的なリモートセンシング変更検出
- Authors: Luosheng Xu, Dalin Zhang, Zhaohui Song,
- Abstract要約: 私たちはFlickCDを提案します。
4つのベンチマークデータセットの実験により、FlickCDは計算とストレージのオーバーヘッドを1桁以上削減することを示した。
- 参考スコア(独自算出の注目度): 4.208862548491969
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing change detection is essential for monitoring urban expansion, disaster assessment, and resource management, offering timely, accurate, and large-scale insights into dynamic landscape transformations. While deep learning has revolutionized change detection, the increasing complexity and computational demands of modern models have not necessarily translated into significant accuracy gains. Instead of following this trend, this study explores a more efficient approach, focusing on lightweight models that maintain high accuracy while minimizing resource consumption, which is an essential requirement for on-satellite processing. To this end, we propose FlickCD, which means quick flick then get great results, pushing the boundaries of the performance-resource trade-off. FlickCD introduces an Enhanced Difference Module (EDM) to amplify critical feature differences between temporal phases while suppressing irrelevant variations such as lighting and weather changes, thereby reducing computational costs in the subsequent change decoder. Additionally, the FlickCD decoder incorporates Local-Global Fusion Blocks, leveraging Shifted Window Self-Attention (SWSA) and Enhanced Global Self-Attention (EGSA) to efficiently capture semantic information at multiple scales, preserving both coarse- and fine-grained changes. Extensive experiments on four benchmark datasets demonstrate that FlickCD reduces computational and storage overheads by more than an order of magnitude while achieving state-of-the-art (SOTA) performance or incurring only a minor (<1\% F1) accuracy trade-off. The implementation code is publicly available at https://github.com/xulsh8/FlickCD.
- Abstract(参考訳): リモートセンシング変化検出は、都市の拡張、災害評価、資源管理の監視に不可欠であり、動的景観変化に対するタイムリーで正確で大規模な洞察を提供する。
ディープラーニングは変化検出に革命をもたらしたが、現代モデルの複雑さと計算要求の増大は必ずしも重要な精度向上に必ずしも変換されていない。
この傾向に従う代わりに、本研究では、オンサテライト処理の必須要件であるリソース消費を最小限にしつつ、高い精度を維持する軽量モデルに焦点をあてて、より効率的なアプローチを模索する。
この目的のために、我々はFlickCDを提案します。つまり、素早くフリックして、素晴らしい結果を得ることができ、パフォーマンスとリソースのトレードオフの境界を押し進めます。
FlickCDは、時間相間の重要な特徴差を増幅する拡張差分モジュール(EDM)を導入し、照明や天候の変化など無関係な変化を抑え、その後の変更デコーダの計算コストを削減した。
さらに、FlickCDデコーダは、SWSA(Shifted Window Self-Attention)とEGSA(Enhanced Global Self-Attention)を活用して、複数のスケールでセマンティック情報を効率的にキャプチャし、粗い変更ときめ細かい変更の両方を保存するローカル・グローバル・フュージョンブロックを組み込んでいる。
4つのベンチマークデータセットに対する大規模な実験により、FlickCDは、最先端(SOTA)のパフォーマンスを達成しつつ、計算とストレージのオーバーヘッドを1桁以上削減する。
実装コードはhttps://github.com/xulsh8/FlickCDで公開されている。
関連論文リスト
- Lightweight Task-Oriented Semantic Communication Empowered by Large-Scale AI Models [66.57755931421285]
大規模人工知能(LAI)モデルは、リアルタイム通信シナリオにおいて重大な課題を提起する。
本稿では,LAIモデルから知識を抽出・凝縮するために知識蒸留(KD)技術を活用することを提案する。
本稿では,反復推論の必要性を排除したプレストア圧縮機構を備えた高速蒸留法を提案する。
論文 参考訳(メタデータ) (2025-06-16T08:42:16Z) - LDGNet: A Lightweight Difference Guiding Network for Remote Sensing Change Detection [6.554696547472252]
光リモートセンシングによる変化検出を誘導する軽量差分誘導ネットワーク(LDGNet)を提案する。
まず、軽量バックボーンネットワークの特徴表現能力を高めるために、差分誘導モジュール(DGM)を提案する。
次に,Visual State Space Model (VSSM) を用いたDADFモジュールを提案する。
論文 参考訳(メタデータ) (2025-04-07T13:33:54Z) - SparseFormer: Detecting Objects in HRW Shots via Sparse Vision Transformer [62.11796778482088]
本稿では,近接撮影とHRW撮影のオブジェクト検出のギャップを埋めるために,SparseFormerと呼ばれるモデル非依存のスパース視覚変換器を提案する。
提案されたSparseFormerは、オブジェクトを含む可能性のあるスパース分散ウィンドウを精査するために、注意トークンを選択的に使用する。
2つのHRWベンチマークであるPANDAとDOTA-v1.0の実験により、提案されたSparseFormerは、最先端のアプローチよりも検出精度(最大5.8%)と速度(最大3倍)を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-02-11T03:21:25Z) - Towards Resource-Efficient Federated Learning in Industrial IoT for Multivariate Time Series Analysis [50.18156030818883]
異常と欠落したデータは、産業応用における厄介な問題を構成する。
ディープラーニングによる異常検出が重要な方向として現れている。
エッジデバイスで収集されたデータは、ユーザのプライバシを含む。
論文 参考訳(メタデータ) (2024-11-06T15:38:31Z) - LCD-Net: A Lightweight Remote Sensing Change Detection Network Combining Feature Fusion and Gating Mechanism [6.5655751924536006]
リモートセンシング画像変化検出(RSCD)は動的表面変化の監視に不可欠である。
従来のCNNベースの手法は、高い計算複雑性と大きなパラメータ数に悩まされている。
本稿では,高検出性能を維持しつつ,モデルサイズと計算コストを低減する軽量な変更検出ネットワーク(LCD-Net)を提案する。
論文 参考訳(メタデータ) (2024-10-14T10:33:30Z) - Relating CNN-Transformer Fusion Network for Change Detection [23.025190360146635]
RCTNetは、空間的特徴と時間的特徴の両方を利用する早期融合バックボーンを導入した。
実験では、従来のRS画像CD法よりもRCTNetの方が明らかに優れていることを示した。
論文 参考訳(メタデータ) (2024-07-03T14:58:40Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - PREM: A Simple Yet Effective Approach for Node-Level Graph Anomaly
Detection [65.24854366973794]
ノードレベルのグラフ異常検出(GAD)は、医学、ソーシャルネットワーク、eコマースなどの分野におけるグラフ構造化データから異常ノードを特定する上で重要な役割を果たす。
本稿では,GADの効率を向上させるために,PREM (preprocessing and Matching) という簡単な手法を提案する。
我々のアプローチは、強力な異常検出機能を維持しながら、GADを合理化し、時間とメモリ消費を削減します。
論文 参考訳(メタデータ) (2023-10-18T02:59:57Z) - Efficient Decoder-free Object Detection with Transformers [75.00499377197475]
視覚変換器(ViT)は、物体検出アプローチのランドスケープを変化させている。
本稿では,デコーダフリー完全トランス(DFFT)オブジェクト検出器を提案する。
DFFT_SMALLは、トレーニングおよび推論段階で高い効率を達成する。
論文 参考訳(メタデータ) (2022-06-14T13:22:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。