論文の概要: Super-resolution-based Change Detection Network with Stacked Attention
Module for Images with Different Resolutions
- arxiv url: http://arxiv.org/abs/2103.00188v1
- Date: Sat, 27 Feb 2021 11:17:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 16:56:43.087481
- Title: Super-resolution-based Change Detection Network with Stacked Attention
Module for Images with Different Resolutions
- Title(参考訳): 異なる解像度の画像に対するスタックアテンテンションモジュールを用いたスーパーレゾリューションベースの変化検出ネットワーク
- Authors: Mengxi Liu, Qian Shi, Andrea Marinoni, Da He, Xiaoping Liu, Liangpei
Zhang
- Abstract要約: 環境保護と都市計画において,変化検出は重要な役割を担っている。
従来のサブピクセルに基づく、解像度の異なる画像による変更検出は、重大なエラー蓄積につながる可能性がある。
注目モジュールを積み重ねた超解像型変化検出ネットワーク(SRCDNet)を提案する。
- 参考スコア(独自算出の注目度): 20.88671966047938
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Change detection, which aims to distinguish surface changes based on
bi-temporal images, plays a vital role in ecological protection and urban
planning. Since high resolution (HR) images cannot be typically acquired
continuously over time, bi-temporal images with different resolutions are often
adopted for change detection in practical applications. Traditional
subpixel-based methods for change detection using images with different
resolutions may lead to substantial error accumulation when HR images are
employed; this is because of intraclass heterogeneity and interclass
similarity. Therefore, it is necessary to develop a novel method for change
detection using images with different resolutions, that is more suitable for HR
images. To this end, we propose a super-resolution-based change detection
network (SRCDNet) with a stacked attention module. The SRCDNet employs a super
resolution (SR) module containing a generator and a discriminator to directly
learn SR images through adversarial learning and overcome the resolution
difference between bi-temporal images. To enhance the useful information in
multi-scale features, a stacked attention module consisting of five
convolutional block attention modules (CBAMs) is integrated to the feature
extractor. The final change map is obtained through a metric learning-based
change decision module, wherein a distance map between bi-temporal features is
calculated. The experimental results demonstrate the superiority of the
proposed method, which not only outperforms all baselines -with the highest F1
scores of 87.40% on the building change detection dataset and 92.94% on the
change detection dataset -but also obtains the best accuracies on experiments
performed with images having a 4x and 8x resolution difference. The source code
of SRCDNet will be available at https://github.com/liumency/SRCDNet.
- Abstract(参考訳): 両時間画像に基づく表面変化の識別を目的とした変化検出は,環境保護と都市計画において重要な役割を担っている。
高分解能(HR)画像は通常、時間とともに連続的に取得できないため、実用的な用途では、異なる解像度のバイテンポラル画像がしばしば採用される。
解像度の異なる画像を用いた従来のサブピクセルベースの変化検出手法は、HR画像が使用される際にかなりの誤差の蓄積につながる可能性がある。
したがって、HR画像に適した、異なる解像度の画像を用いた変化検出のための新しい方法を開発する必要があります。
そこで本研究では,注意モジュールを積み重ねたスーパーリゾリューションベースの変化検出ネットワーク(SRCDNet)を提案する。
SRCDNetは、ジェネレータと判別器を含むスーパーリゾリューション(SR)モジュールを使用して、対比学習を通じてSR画像を直接学習し、両時間画像間のリゾリューション差を克服します。
マルチスケール機能において有用な情報を高めるために、5つの畳み込みブロック注意モジュール(CBAM)からなるスタックド注意モジュールを特徴抽出器に統合する。
最終変更マップは、二時間特徴間の距離マップを算出したメトリック学習に基づく変更決定モジュールによって得られる。
実験結果は, 建物変化検出データセットの最高F1スコア87.40%, 変化検出データセットの92.94%と, すべてのベースラインを上回っただけでなく, 4倍と8倍の解像度差を持つ画像を用いた実験で最高の精度が得られることを実証した。
SRCDNetのソースコードはhttps://github.com/liumency/SRCDNetで入手できる。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - BD-MSA: Body decouple VHR Remote Sensing Image Change Detection method
guided by multi-scale feature information aggregation [4.659935767219465]
リモートセンシング画像変化検出(RSCD)の目的は、同じ場所で撮影された両時間画像の違いを検出することである。
深層学習はRSCDタスクに広く使われており、結果認識の点で重要な結果をもたらしている。
論文 参考訳(メタデータ) (2024-01-09T02:53:06Z) - TransY-Net:Learning Fully Transformer Networks for Change Detection of
Remote Sensing Images [64.63004710817239]
リモートセンシング画像CDのためのトランスフォーマーベース学習フレームワークTransY-Netを提案する。
グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。
提案手法は,4つの光学式および2つのSAR画像CDベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-22T07:42:19Z) - A Dual Attentive Generative Adversarial Network for Remote Sensing Image
Change Detection [6.906936669510404]
本稿では,高分解能なリモートセンシング画像変化検出タスクを実現するために,二重注意生成対向ネットワークを提案する。
DAGANフレームワークは、85.01%がIoU、91.48%がF1スコアであり、LEVIRデータセットの先進的な手法よりもパフォーマンスが良い。
論文 参考訳(メタデータ) (2023-10-03T08:26:27Z) - Continuous Cross-resolution Remote Sensing Image Change Detection [28.466756872079472]
実世界のアプリケーションは、空間解像度の異なるバイテンポラルイメージに基づいて、クロスレゾリューション変化検出(別名、CD)の必要性を高める。
本研究では,様々な解像度差の合成サンプルから得られたHR結果を連続的に予測するモデルを実現するために,スケール不変学習を提案する。
提案手法は,3つのデータセット上で,いくつかのバニラCD法と2つのクロスレゾリューションCD法より有意に優れていた。
論文 参考訳(メタデータ) (2023-05-24T04:57:24Z) - IDAN: Image Difference Attention Network for Change Detection [3.5366052026723547]
リモートセンシング画像変化検出のための新しい画像差分注意ネットワーク(IDAN)を提案する。
IDANは、画像の地域的特徴とエッジ的特徴の違いを考慮し、抽出した画像特徴を最適化する。
実験の結果、IDANのF1スコアは、WHUデータセットとLEVIR-CDデータセットのベースラインモデルと比較して1.62%と1.98%改善していることが示された。
論文 参考訳(メタデータ) (2022-08-17T13:46:13Z) - dual unet:a novel siamese network for change detection with cascade
differential fusion [4.651756476458979]
本稿では,変化検出タスク,すなわちDual-UNetのための新しいSiameseニューラルネットワークを提案する。
従来のバイテンポラル画像の符号化とは対照的に,画素の空間的差分関係に着目したエンコーダ差分アテンションモジュールを設計する。
実験により、提案手法は、一般的な季節変化検出データセットにおいて、常に最も高度な手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-08-12T14:24:09Z) - Learning Resolution-Adaptive Representations for Cross-Resolution Person
Re-Identification [49.57112924976762]
低解像度(LR)クエリIDイメージと高解像度(HR)ギャラリーイメージとの整合性を実現する。
実際のカメラとの違いにより、クエリ画像が分解能の低下に悩まされることがしばしばあるため、これは困難かつ実用的な問題である。
本稿では,問合せ画像の解像度に適応する動的計量を用いて,HRとLRの画像を直接比較するためのSRフリーなパラダイムについて検討する。
論文 参考訳(メタデータ) (2022-07-09T03:49:51Z) - Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。
この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。
本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文 参考訳(メタデータ) (2020-10-12T13:26:30Z) - MuCAN: Multi-Correspondence Aggregation Network for Video
Super-Resolution [63.02785017714131]
ビデオ超解像(VSR)は、複数の低解像度フレームを使用して、各フレームに対して高解像度の予測を生成することを目的としている。
フレーム間およびフレーム内は、時間的および空間的情報を利用するための鍵となるソースである。
VSRのための効果的なマルチ対応アグリゲーションネットワーク(MuCAN)を構築した。
論文 参考訳(メタデータ) (2020-07-23T05:41:27Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。