論文の概要: MaskCD: A Remote Sensing Change Detection Network Based on Mask Classification
- arxiv url: http://arxiv.org/abs/2404.12081v1
- Date: Thu, 18 Apr 2024 11:05:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-19 12:41:30.597650
- Title: MaskCD: A Remote Sensing Change Detection Network Based on Mask Classification
- Title(参考訳): MaskCD:マスク分類に基づくリモートセンシング変更検出ネットワーク
- Authors: Weikang Yu, Xiaokang Zhang, Samiran Das, Xiao Xiang Zhu, Pedram Ghamisi,
- Abstract要約: 深層学習を用いたリモートセンシング(RS)画像からの変化(CD)を文献的に広く研究している。
入力画像対から分類マスクを適応的に生成し,変化領域を検出するMaskCDを提案する。
ピクセルワイズ表現を学習可能なマスク提案に復号することで、望まれる変更対象を再構築する。
- 参考スコア(独自算出の注目度): 29.15203530375882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Change detection (CD) from remote sensing (RS) images using deep learning has been widely investigated in the literature. It is typically regarded as a pixel-wise labeling task that aims to classify each pixel as changed or unchanged. Although per-pixel classification networks in encoder-decoder structures have shown dominance, they still suffer from imprecise boundaries and incomplete object delineation at various scenes. For high-resolution RS images, partly or totally changed objects are more worthy of attention rather than a single pixel. Therefore, we revisit the CD task from the mask prediction and classification perspective and propose MaskCD to detect changed areas by adaptively generating categorized masks from input image pairs. Specifically, it utilizes a cross-level change representation perceiver (CLCRP) to learn multiscale change-aware representations and capture spatiotemporal relations from encoded features by exploiting deformable multihead self-attention (DeformMHSA). Subsequently, a masked-attention-based detection transformers (MA-DETR) decoder is developed to accurately locate and identify changed objects based on masked attention and self-attention mechanisms. It reconstructs the desired changed objects by decoding the pixel-wise representations into learnable mask proposals and making final predictions from these candidates. Experimental results on five benchmark datasets demonstrate the proposed approach outperforms other state-of-the-art models. Codes and pretrained models are available online (https://github.com/EricYu97/MaskCD).
- Abstract(参考訳): 深層学習を用いたリモートセンシング(RS)画像からの変化検出(CD)を文献で広く研究している。
一般的には、各ピクセルを変更または変更せずに分類することを目的とした、ピクセルワイドなラベリングタスクと見なされる。
エンコーダ・デコーダ構造における画素単位の分類網は優位性を示しているが、様々な場面で不正確な境界や不完全な物体のデライン化に悩まされている。
高解像度のRS画像の場合、部分的または完全に変更されたオブジェクトは単一のピクセルよりも注目に値する。
そこで、マスク予測と分類の観点からCDタスクを再検討し、入力画像対から分類マスクを適応的に生成することにより変化領域を検出するMaskCDを提案する。
具体的には、CLCRP(cross-level change representation perceiver)を使用して、変形可能なマルチヘッド自己アテンション(DeformMHSA)を利用して、マルチスケールな変化認識表現を学習し、符号化された特徴から時空間関係をキャプチャする。
その後、マスクアテンションに基づく検出トランスフォーマ(MA-DETR)デコーダを開発し、マスクアテンションと自己アテンション機構に基づいて、変更対象を正確に特定・識別する。
ピクセルワイズ表現を学習可能なマスク提案に復号し、これらの候補から最終的な予測を行うことで、望まれる変更対象を再構築する。
5つのベンチマークデータセットの実験結果は、提案手法が他の最先端モデルよりも優れていることを示している。
コードと事前訓練されたモデルはオンラインで入手できる(https://github.com/EricYu97/MaskCD)。
関連論文リスト
- Rethinking Remote Sensing Change Detection With A Mask View [6.3921187411592655]
リモートセンシング変化検出は、同じ領域で記録された2つ以上の画像を比較することを目的としているが、異なるスタンプで、地理的実体や環境要因の変化を評価する。
この欠点に対処するために、マスクビューによる変更検出を再考し、さらに、1)メタアーキテクチャCDMaskと2)インスタンスネットワークCDMaskFormerを提案する。
論文 参考訳(メタデータ) (2024-06-21T17:27:58Z) - Siamese Masked Autoencoders [76.35448665609998]
ビデオから視覚的対応を学習するために,Siamese Masked Autoencoders(SiamMAE)を提案する。
SiamMAEはランダムにサンプリングされたビデオフレームのペアで動作し、非対称にそれらをマスクする。
ビデオオブジェクトのセグメンテーション、キーポイントのプロパゲーション、セマンティック部分のプロパゲーションタスクにおいて、最先端の自己管理手法よりも優れています。
論文 参考訳(メタデータ) (2023-05-23T17:59:46Z) - Improving Masked Autoencoders by Learning Where to Mask [65.89510231743692]
マスケ画像モデリングは視覚データに対する有望な自己教師型学習手法である。
本稿では,Gumbel-Softmax を用いて,対向学習マスク生成装置とマスク誘導画像モデリングプロセスとを相互接続するフレームワーク AutoMAE を提案する。
実験の結果,AutoMAEは,標準の自己監督型ベンチマークや下流タスクに対して,効果的な事前学習モデルを提供することがわかった。
論文 参考訳(メタデータ) (2023-03-12T05:28:55Z) - Towards Robust Video Object Segmentation with Adaptive Object
Calibration [18.094698623128146]
ビデオオブジェクトセグメンテーション(VOS)は、参照フレームの注釈付きオブジェクトマスクを与えられたビデオのすべてのターゲットフレームにおけるオブジェクトのセグメンテーションを目的としている。
本稿では,オブジェクト表現を適応的に構築し,オブジェクトマスクを校正して強靭性を実現する,新しいディープネットワークを提案する。
本モデルは,既存の出版作品の最先端性能を達成し,摂動に対する優れた堅牢性を示す。
論文 参考訳(メタデータ) (2022-07-02T17:51:29Z) - Context Autoencoder for Self-Supervised Representation Learning [64.63908944426224]
符号化された表現空間で予測を行うことにより、符号化器を事前訓練する。
ネットワークはエンコーダ/レグレッサ/デコーダアーキテクチャである。
下流タスクにおける転送性能の向上によるCAEの有効性を実証する。
論文 参考訳(メタデータ) (2022-02-07T09:33:45Z) - Image Inpainting with Edge-guided Learnable Bidirectional Attention Maps [85.67745220834718]
不規則な穴の画像インペインティングを改善するためのエッジガイド学習可能な双方向注意マップ(Edge-LBAM)を紹介します。
当社のEdge-LBAMメソッドには、予測エッジによる構造認識マスク更新を含むデュアルプロシージャが含まれています。
広範な実験により,エッジlbamはコヒーレントな画像構造を生成し,色差やぼやけを防止できることがわかった。
論文 参考訳(メタデータ) (2021-04-25T07:25:16Z) - OLED: One-Class Learned Encoder-Decoder Network with Adversarial Context
Masking for Novelty Detection [1.933681537640272]
新規性検出は、対象クラスの分布に属さないサンプルを認識するタスクである。
ディープオートエンコーダは多くの教師なしのノベルティ検出法のベースとして広く使われている。
我々は,MaskモジュールとReconstructorという2つの競合するネットワークからなるフレームワークを設計した。
論文 参考訳(メタデータ) (2021-03-27T17:59:40Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - A Weakly Supervised Convolutional Network for Change Segmentation and
Classification [91.3755431537592]
W-CDNetは、画像レベルのセマンティックラベルでトレーニングできる、弱い教師付き変更検出ネットワークである。
W-CDNetは、2つの異なるタイプのデータセットでトレーニングすることができる。
論文 参考訳(メタデータ) (2020-11-06T20:20:45Z) - Two-Phase Object-Based Deep Learning for Multi-temporal SAR Image Change
Detection [23.2069257991734]
変化検出は合成開口レーダ(SAR)画像の基本的な応用の1つである。
SAR画像に現れるスペックルノイズは、変化検出に非常に悪影響を及ぼす。
多時間SAR画像変化検出のための2相オブジェクトベースディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2020-01-17T11:51:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。