論文の概要: MultiScale Probability Map guided Index Pooling with Attention-based
learning for Road and Building Segmentation
- arxiv url: http://arxiv.org/abs/2302.09411v1
- Date: Sat, 18 Feb 2023 19:57:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 18:47:21.453433
- Title: MultiScale Probability Map guided Index Pooling with Attention-based
learning for Road and Building Segmentation
- Title(参考訳): 注意に基づく道路・建物セグメンテーション学習による多スケール確率マップ誘導インデックスプーリング
- Authors: Shirsha Bose, Ritesh Sur Chowdhury, Debabrata Pal, Shivashish Bose,
Biplab Banerjee, Subhasis Chaudhuri
- Abstract要約: MSSDMPA-Net(Multi-Scale Supervised Dilated Multiple-Path Attention Network)を提案する。
MSSDMPA-NetはDAMIP(Dynamic Attention Map Guided Index Pooling)とDAMSCA(Dynamic Attention Map Guided Spatial and Channel Attention)という2つの新しいモジュールを備えている。
- 参考スコア(独自算出の注目度): 18.838213902873616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient road and building footprint extraction from satellite images are
predominant in many remote sensing applications. However, precise segmentation
map extraction is quite challenging due to the diverse building structures
camouflaged by trees, similar spectral responses between the roads and
buildings, and occlusions by heterogeneous traffic over the roads. Existing
convolutional neural network (CNN)-based methods focus on either enriched
spatial semantics learning for the building extraction or the fine-grained road
topology extraction. The profound semantic information loss due to the
traditional pooling mechanisms in CNN generates fragmented and disconnected
road maps and poorly segmented boundaries for the densely spaced small
buildings in complex surroundings. In this paper, we propose a novel
attention-aware segmentation framework, Multi-Scale Supervised Dilated
Multiple-Path Attention Network (MSSDMPA-Net), equipped with two new modules
Dynamic Attention Map Guided Index Pooling (DAMIP) and Dynamic Attention Map
Guided Spatial and Channel Attention (DAMSCA) to precisely extract the building
footprints and road maps from remotely sensed images. DAMIP mines the salient
features by employing a novel index pooling mechanism to retain important
geometric information. On the other hand, DAMSCA simultaneously extracts the
multi-scale spatial and spectral features. Besides, using dilated convolution
and multi-scale deep supervision in optimizing MSSDMPA-Net helps achieve
stellar performance. Experimental results over multiple benchmark building and
road extraction datasets, ensures MSSDMPA-Net as the state-of-the-art (SOTA)
method for building and road extraction.
- Abstract(参考訳): 衛星画像からの効率的な道路や建物の足跡の抽出は、多くのリモートセンシングアプリケーションで主流である。
しかし,木々によって迷彩された多様な建物構造,道路と建物のスペクトル応答の類似,道路上の不均質な交通による閉塞などにより,正確なセグメンテーションマップの抽出は困難である。
既存の畳み込みニューラルネットワーク(cnn)ベースの手法は、建物抽出のための空間的意味学習と、細粒度の道路トポロジー抽出に重点を置いている。
CNNの伝統的なプール機構による深いセマンティック情報損失は、複雑な周囲の密集した小さな建物に対して、断片化され、切り離された道路地図と区切られた境界を生じる。
本論文では,新しい注意対応セグメンテーションフレームワークであるmssdmpa-net(multi-scale supervised dilated multi-path attention network)を提案する。このネットワークには,動的注意マップ誘導インデックスプーリング(damip)と動的注意マップ誘導空間およびチャネル注意(damsca)という2つのモジュールが組み込まれており,リモートセンシング画像から建物足跡と道路地図を正確に抽出する。
DAMIPは、重要な幾何学的情報を保持するために、新しいインデックスプーリング機構を用いて、健全な特徴をマイニングする。
一方、DAMSCAは、マルチスケールの空間的特徴とスペクトル的特徴を同時に抽出する。
さらに、拡張畳み込みとMSSDMPA-Netの最適化におけるマルチスケールの深い監督は、恒星の性能向上に役立つ。
複数のベンチマーク構築と道路抽出データセットに対する実験結果から,MSSDMPA-Net を構築・道路抽出のための最先端(SOTA) 手法として保証する。
関連論文リスト
- Automated Road Extraction from Satellite Imagery Integrating Dense Depthwise Dilated Separable Spatial Pyramid Pooling with DeepLabV3+ [6.938896632981995]
道路抽出はリモートセンシングアプリケーションのサブドメインである。
DeepLabシリーズはセマンティックセグメンテーションの習熟度で知られており、道路の様々な性質に起因するこれらの課題に対処している。
本研究では, DenseDDSSPPと適切に選択されたバックボーンネットワークとSqueeze-and-Excitationブロックを組み合わせることで, 効率的な高密度特徴写像が生成されることを仮定する。
論文 参考訳(メタデータ) (2024-10-18T19:14:07Z) - Pyramid Feature Attention Network for Monocular Depth Prediction [8.615717738037823]
本稿では,高レベルな文脈特徴と低レベルな空間特徴を改善するために,ピラミッド特徴注意ネットワーク(PFANet)を提案する。
提案手法は,KITTIデータセット上での最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-03T08:33:23Z) - Active Neural Topological Mapping for Multi-Agent Exploration [24.91397816926568]
マルチエージェント協調探索問題では、複数のエージェントが限られた時間で感覚信号を介して見えない環境を探索する必要がある。
トポロジカルマップは、抽象的だが不可欠な情報を持つノードとエッジのみからなる、有望な代替手段である。
深層強化学習は、高速なエンドツーエンド推論を通じて(ほぼ)最適ポリシーを学ぶ大きな可能性を示している。
マルチエージェント探索作業における探索効率の向上と一般化を目的とした,Multi-Agent Neural Topological Mapping (MANTM)を提案する。
論文 参考訳(メタデータ) (2023-11-01T03:06:14Z) - Aerial Images Meet Crowdsourced Trajectories: A New Approach to Robust
Road Extraction [110.61383502442598]
我々は、Cross-Modal Message Propagation Network (CMMPNet)と呼ばれる新しいニューラルネットワークフレームワークを紹介する。
CMMPNetは、モダリティ固有の表現学習のための2つのディープオートエンコーダと、クロスモーダル表現洗練のためのテーラー設計のデュアルエンハンスメントモジュールで構成されている。
実世界の3つのベンチマーク実験により, CMMPNetによる堅牢な道路抽出の有効性が示された。
論文 参考訳(メタデータ) (2021-11-30T04:30:10Z) - SPIN Road Mapper: Extracting Roads from Aerial Images via Spatial and
Interaction Space Graph Reasoning for Autonomous Driving [64.10636296274168]
道路抽出は、自律航法システムを構築するための重要なステップである。
この問題に対して単に畳み込みニューラルネットワーク(ConvNets)を使用することは、画像内の道路セグメント間の遠い依存関係をキャプチャする非効率であるため、効果がない。
本研究では,ConvNetに接続した時,特徴写像から投影された空間空間および相互作用空間上に構築されたグラフの推論を行う空間空間グラフ推論(SPIN)モジュールを提案する。
論文 参考訳(メタデータ) (2021-09-16T03:52:17Z) - Residual Moment Loss for Medical Image Segmentation [56.72261489147506]
位置情報は,対象物体の多様体構造を捉えた深層学習モデルに有効であることが証明された。
既存のほとんどの手法は、ネットワークが学習するために、位置情報を暗黙的にエンコードする。
セグメント化対象の位置情報を明示的に埋め込むために,新しい損失関数,すなわち残差モーメント(RM)損失を提案する。
論文 参考訳(メタデータ) (2021-06-27T09:31:49Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z) - PP-LinkNet: Improving Semantic Segmentation of High Resolution Satellite
Imagery with Multi-stage Training [4.694536172504848]
道路網と建築物のフットプリント抽出は、地図の更新、交通規制、都市計画、ライドシェアリング、災害対応テキストテットックなど、多くのアプリケーションにとって不可欠である。
論文 参考訳(メタデータ) (2020-10-14T10:23:48Z) - A novel Deep Structure U-Net for Sea-Land Segmentation in Remote Sensing
Images [30.39131853354783]
本稿では,Residual Dense U-Net (RDU-Net) を用いた画素ワイド海面分割のための新しいディープニューラルネットワーク構造を提案する。
RDU-Netは、十分な結果を得るために、ダウンサンプリングとアップサンプリングの2つのパスの組み合わせである。
論文 参考訳(メタデータ) (2020-03-17T16:00:59Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。