論文の概要: T-UNet: Triplet UNet for Change Detection in High-Resolution Remote
Sensing Images
- arxiv url: http://arxiv.org/abs/2308.02356v1
- Date: Fri, 4 Aug 2023 14:44:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-07 12:45:00.315599
- Title: T-UNet: Triplet UNet for Change Detection in High-Resolution Remote
Sensing Images
- Title(参考訳): T-UNet:高解像度リモートセンシング画像における変化検出のためのトリプルトUNet
- Authors: Huan Zhong and Chen Wu
- Abstract要約: 現在、ほとんどの変更検出方法は、シームズネットワーク構造または初期の核融合構造に基づいている。
本稿では,3分岐エンコーダをベースとしたTriplet UNet(T-UNet)を提案する。
デコーダの段階では、詳細なテクスチャ情報を完全にマイニングし統合するためのチャネルアテンション機構(CAM)と空間アテンション機構(SAM)を導入する。
- 参考スコア(独自算出の注目度): 5.849243433046327
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing image change detection aims to identify the differences
between images acquired at different times in the same area. It is widely used
in land management, environmental monitoring, disaster assessment and other
fields. Currently, most change detection methods are based on Siamese network
structure or early fusion structure. Siamese structure focuses on extracting
object features at different times but lacks attention to change information,
which leads to false alarms and missed detections. Early fusion (EF) structure
focuses on extracting features after the fusion of images of different phases
but ignores the significance of object features at different times for
detecting change details, making it difficult to accurately discern the edges
of changed objects. To address these issues and obtain more accurate results,
we propose a novel network, Triplet UNet(T-UNet), based on a three-branch
encoder, which is capable to simultaneously extract the object features and the
change features between the pre- and post-time-phase images through triplet
encoder. To effectively interact and fuse the features extracted from the three
branches of triplet encoder, we propose a multi-branch spatial-spectral
cross-attention module (MBSSCA). In the decoder stage, we introduce the channel
attention mechanism (CAM) and spatial attention mechanism (SAM) to fully mine
and integrate detailed textures information at the shallow layer and semantic
localization information at the deep layer.
- Abstract(参考訳): リモートセンシング画像変化検出は、同じ領域で異なる時間に取得した画像の違いを特定することを目的としている。
土地管理、環境モニタリング、災害評価などの分野で広く利用されている。
現在、ほとんどの変更検出方法は、シームズネットワーク構造または初期の融合構造に基づいている。
シームズ構造は、異なるタイミングでオブジェクトの特徴を抽出することに焦点を当てるが、変更情報への注意が欠如し、誤報や検出の失敗につながる。
初期融合(EF)構造は、異なる位相の画像の融合後の特徴の抽出に重点を置いているが、変化の詳細を検出するために異なる時刻におけるオブジェクトの特徴の重要性を無視しているため、変化したオブジェクトのエッジを正確に識別することは困難である。
これらの問題に対処し、より正確な結果を得るため、トリプレットエンコーダを介して、被写体の特徴と後相画像間の変化を同時に抽出できる3分岐エンコーダに基づく新しいネットワークであるトリプレットunet(t-unet)を提案する。
トリプルトエンコーダの3つの枝から抽出した特徴を効果的に相互作用・融合するために,マルチブランチ空間スペクトル横断モジュール(MBSSCA)を提案する。
デコーダの段階では、浅い層における詳細なテクスチャ情報と深層におけるセマンティックローカライゼーション情報を完全にマイニングし統合するためのチャネルアテンション機構(CAM)と空間アテンション機構(SAM)を導入する。
関連論文リスト
- DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - TransY-Net:Learning Fully Transformer Networks for Change Detection of
Remote Sensing Images [64.63004710817239]
リモートセンシング画像CDのためのトランスフォーマーベース学習フレームワークTransY-Netを提案する。
グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。
提案手法は,4つの光学式および2つのSAR画像CDベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-22T07:42:19Z) - Multimodal Transformer Using Cross-Channel attention for Object Detection in Remote Sensing Images [1.662438436885552]
マルチモーダル融合は、複数のモーダルからのデータを融合することで精度を高めることが決定されている。
早期に異なるチャネル間の関係をマッピングするための新しいマルチモーダル融合戦略を提案する。
本手法は,中期・後期の手法とは対照的に,早期の融合に対処することにより,既存の手法と比較して,競争力や性能に優れる。
論文 参考訳(メタデータ) (2023-10-21T00:56:11Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - STNet: Spatial and Temporal feature fusion network for change detection
in remote sensing images [5.258365841490956]
空間的・時間的特徴融合に基づくリモートセンシング変化検出ネットワークSTNetを提案する。
RSCDのための3つのベンチマークデータセットの実験結果から,提案手法が最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2023-04-22T14:40:41Z) - DETR4D: Direct Multi-View 3D Object Detection with Sparse Attention [50.11672196146829]
サラウンドビュー画像を用いた3次元物体検出は、自動運転にとって必須の課題である。
マルチビュー画像における3次元オブジェクト検出のためのスパースアテンションと直接特徴クエリを探索するトランスフォーマーベースのフレームワークであるDETR4Dを提案する。
論文 参考訳(メタデータ) (2022-12-15T14:18:47Z) - Towards Complex Backgrounds: A Unified Difference-Aware Decoder for
Binary Segmentation [4.6932442139663015]
本稿では、差分認識デコーダと呼ばれる新しい統合二重分岐デコーダパラダイムを提案する。
差分認識デコーダは、エンコーダによって出力されるマルチレベル特徴を用いて、人間の目を3段階に模倣する。
その結果、差認識デコーダは、他の最先端のバイナリセグメンテーション手法よりも高い精度で実現できることを示した。
論文 参考訳(メタデータ) (2022-10-27T03:45:29Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - dual unet:a novel siamese network for change detection with cascade
differential fusion [4.651756476458979]
本稿では,変化検出タスク,すなわちDual-UNetのための新しいSiameseニューラルネットワークを提案する。
従来のバイテンポラル画像の符号化とは対照的に,画素の空間的差分関係に着目したエンコーダ差分アテンションモジュールを設計する。
実験により、提案手法は、一般的な季節変化検出データセットにおいて、常に最も高度な手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-08-12T14:24:09Z) - Cross-Modality 3D Object Detection [63.29935886648709]
本稿では,3次元物体検出のための新しい2段階多モード融合ネットワークを提案する。
アーキテクチャ全体が2段階の融合を促進する。
KITTIデータセットを用いた実験により,提案したマルチステージ融合により,ネットワークがより良い表現を学習できることが示唆された。
論文 参考訳(メタデータ) (2020-08-16T11:01:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。