論文の概要: An Attention-Fused Network for Semantic Segmentation of
Very-High-Resolution Remote Sensing Imagery
- arxiv url: http://arxiv.org/abs/2105.04132v1
- Date: Mon, 10 May 2021 06:23:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 14:53:39.838155
- Title: An Attention-Fused Network for Semantic Segmentation of
Very-High-Resolution Remote Sensing Imagery
- Title(参考訳): 超高分解能リモートセンシング画像のセマンティクスセグメンテーションのための注意融合ネットワーク
- Authors: Xuan Yang, Shanshan Li, Zhengchao Chen, Jocelyn Chanussot, Xiuping
Jia, Bing Zhang, Baipeng Li, Pan Chen
- Abstract要約: 注目融合ネットワーク(AFNet)という,新しい畳み込みニューラルネットワークアーキテクチャを提案する。
ISPRS Vaihingen 2DデータセットとISPRS Potsdam 2Dデータセットで、総精度91.7%、平均F1スコア90.96%の最先端のパフォーマンスを実現します。
- 参考スコア(独自算出の注目度): 26.362854938949923
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation is an essential part of deep learning. In recent years,
with the development of remote sensing big data, semantic segmentation has been
increasingly used in remote sensing. Deep convolutional neural networks (DCNNs)
face the challenge of feature fusion: very-high-resolution remote sensing image
multisource data fusion can increase the network's learnable information, which
is conducive to correctly classifying target objects by DCNNs; simultaneously,
the fusion of high-level abstract features and low-level spatial features can
improve the classification accuracy at the border between target objects. In
this paper, we propose a multipath encoder structure to extract features of
multipath inputs, a multipath attention-fused block module to fuse multipath
features, and a refinement attention-fused block module to fuse high-level
abstract features and low-level spatial features. Furthermore, we propose a
novel convolutional neural network architecture, named attention-fused network
(AFNet). Based on our AFNet, we achieve state-of-the-art performance with an
overall accuracy of 91.7% and a mean F1 score of 90.96% on the ISPRS Vaihingen
2D dataset and an overall accuracy of 92.1% and a mean F1 score of 93.44% on
the ISPRS Potsdam 2D dataset.
- Abstract(参考訳): セマンティックセグメンテーションは深層学習の重要な部分である。
近年,リモートセンシングビッグデータの開発に伴い,セマンティックセグメンテーションがリモートセンシングに利用されるようになった。
超高解像度のリモートセンシング画像 マルチソースデータフュージョンは、dcnnによってターゲットオブジェクトを正しく分類することを可能にするネットワークの学習可能な情報を増やすことができると同時に、高レベルの抽象的特徴と低レベルの空間的特徴の融合は、ターゲットオブジェクト間の境界における分類精度を向上させることができる。
本稿では,マルチパス入力の特徴を抽出するマルチパスエンコーダ構造,マルチパス特徴を融合するマルチパスアテンション融合ブロックモジュール,高レベル抽象特徴と低レベル空間特徴を融合する改良されたアテンション融合ブロックモジュールを提案する。
さらに,注目融合ネットワーク (AFNet) と呼ばれる新しい畳み込みニューラルネットワークアーキテクチャを提案する。
AFNetに基づいて,ISPRS Vaihingen 2Dデータセットの平均F1スコアは91.7%,ISPRS Vaihingen 2Dデータセットの平均F1スコアは90.96%,ISPRS Potsdam 2Dデータセットの平均F1スコアは92.1%,そして平均F1スコアは93.44%である。
関連論文リスト
- United Domain Cognition Network for Salient Object Detection in Optical Remote Sensing Images [21.76732661032257]
周波数領域と空間領域のグローバルローカル情報を共同で探索する新しい統一ドメイン認知ネットワーク(UDCNet)を提案する。
実験結果から提案したUDCNetが24種類の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-11T04:12:27Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Multi-Scale Direction-Aware Network for Infrared Small Target Detection [2.661766509317245]
赤外小目標検出は、背景とターゲットを効果的に分離することが難しい問題に直面している。
我々は、赤外線小ターゲットの高周波方向特徴を統合するためのマルチスケール方向対応ネットワーク(MSDA-Net)を提案する。
MSDA-Netは、パブリックNUDT-SIRST、SIRST、IRSTD-1kデータセット上で、最先端(SOTA)結果を達成する。
論文 参考訳(メタデータ) (2024-06-04T07:23:09Z) - Lightweight Salient Object Detection in Optical Remote-Sensing Images
via Semantic Matching and Edge Alignment [61.45639694373033]
セマンティックマッチングとエッジアライメントに基づく光リモートセンシング画像(ORSI-SOD)のための新しい軽量ネットワークSeaNetを提案する。
具体的には、機能抽出のための軽量MobileNet-V2、高レベルの機能のための動的セマンティックマッチングモジュール(DSMM)、推論のためのポータブルデコーダが含まれる。
論文 参考訳(メタデータ) (2023-01-07T04:33:51Z) - Semantic Labeling of High Resolution Images Using EfficientUNets and
Transformers [5.177947445379688]
畳み込みニューラルネットワークとディープトランスを組み合わせた新しいセグメンテーションモデルを提案する。
提案手法は,最先端技術と比較してセグメント化精度が向上することを示す。
論文 参考訳(メタデータ) (2022-06-20T12:03:54Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - Specificity-preserving RGB-D Saliency Detection [103.3722116992476]
本稿では,RGB-Dサリエンシ検出のための特異性保存ネットワーク(SP-Net)を提案する。
2つのモダリティ特化ネットワークと共有学習ネットワークを採用し、個別および共有唾液マップを生成する。
6つのベンチマークデータセットの実験では、SP-Netは他の最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-08-18T14:14:22Z) - Multi-Attention-Network for Semantic Segmentation of Fine Resolution
Remote Sensing Images [10.835342317692884]
リモートセンシング画像におけるセマンティックセグメンテーションの精度は、ディープ畳み込みニューラルネットワークによって著しく向上した。
本稿では,これらの問題に対処するマルチアテンション・ネットワーク(MANet)を提案する。
線形複雑性を伴うカーネル注意の新たなアテンション機構が提案され,注目される計算負荷の低減が図られた。
論文 参考訳(メタデータ) (2020-09-03T09:08:02Z) - Binary DAD-Net: Binarized Driveable Area Detection Network for
Autonomous Driving [94.40107679615618]
本稿では,二項化駆動型領域検出ネットワーク(バイナリDAD-Net)を提案する。
エンコーダ、ボトルネック、デコーダ部分の2重みとアクティベーションのみを使用する。
パブリックデータセット上で、最先端のセマンティックセグメンテーションネットワークより優れています。
論文 参考訳(メタデータ) (2020-06-15T07:09:01Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。