論文の概要: Multi-Attention-Network for Semantic Segmentation of Fine Resolution
Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2009.02130v4
- Date: Mon, 23 Nov 2020 12:56:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 08:01:26.885485
- Title: Multi-Attention-Network for Semantic Segmentation of Fine Resolution
Remote Sensing Images
- Title(参考訳): ファインレゾリューションリモートセンシング画像のセマンティクスセグメンテーションのためのマルチアテンションネットワーク
- Authors: Rui Li, Shunyi Zheng, Chenxi Duan, Ce Zhang, Jianlin Su, P.M. Atkinson
- Abstract要約: リモートセンシング画像におけるセマンティックセグメンテーションの精度は、ディープ畳み込みニューラルネットワークによって著しく向上した。
本稿では,これらの問題に対処するマルチアテンション・ネットワーク(MANet)を提案する。
線形複雑性を伴うカーネル注意の新たなアテンション機構が提案され,注目される計算負荷の低減が図られた。
- 参考スコア(独自算出の注目度): 10.835342317692884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation of remote sensing images plays an important role in a
wide range of applications including land resource management, biosphere
monitoring and urban planning. Although the accuracy of semantic segmentation
in remote sensing images has been increased significantly by deep convolutional
neural networks, several limitations exist in standard models. First, for
encoder-decoder architectures such as U-Net, the utilization of multi-scale
features causes the underuse of information, where low-level features and
high-level features are concatenated directly without any refinement. Second,
long-range dependencies of feature maps are insufficiently explored, resulting
in sub-optimal feature representations associated with each semantic class.
Third, even though the dot-product attention mechanism has been introduced and
utilized in semantic segmentation to model long-range dependencies, the large
time and space demands of attention impede the actual usage of attention in
application scenarios with large-scale input. This paper proposed a
Multi-Attention-Network (MANet) to address these issues by extracting
contextual dependencies through multiple efficient attention modules. A novel
attention mechanism of kernel attention with linear complexity is proposed to
alleviate the large computational demand in attention. Based on kernel
attention and channel attention, we integrate local feature maps extracted by
ResNeXt-101 with their corresponding global dependencies and reweight
interdependent channel maps adaptively. Numerical experiments on three
large-scale fine resolution remote sensing images captured by different
satellite sensors demonstrate the superior performance of the proposed MANet,
outperforming the DeepLab V3+, PSPNet, FastFCN, DANet, OCRNet, and other
benchmark approaches.
- Abstract(参考訳): リモートセンシング画像の意味セグメンテーションは、土地資源管理、生物圏モニタリング、都市計画など、幅広いアプリケーションにおいて重要な役割を果たす。
リモートセンシング画像におけるセマンティックセグメンテーションの精度は、深部畳み込みニューラルネットワークによって著しく向上しているが、標準モデルにはいくつかの制限がある。
まず、u-netのようなエンコーダ-デコーダアーキテクチャでは、マルチスケール機能の利用は、低レベル機能と高レベル機能を直接改良することなく結合する情報の使用を過小評価する。
第二に、機能マップの長距離依存性が不十分に探究され、結果として各意味クラスに付随する最適化された特徴表現が生成される。
第3に、dot-product attentionメカニズムがセマンティックセグメンテーションで導入され、長距離依存関係のモデル化に利用されているにもかかわらず、大きな時間と空間の注意の要求は、大規模入力によるアプリケーションシナリオでの注意の実際の使用を妨げている。
本稿では,マルチアテンション・ネットワーク(manet,multi-attention-network)を提案する。
線形複雑化を伴うカーネル注意の新たな注意機構が提案され,注目されている計算要求が軽減される。
カーネルアテンションとチャネルアテンションに基づいて,ResNeXt-101によって抽出された局所特徴写像と対応する大域的依存関係と相互依存チャネルマップを適応的に統合する。
異なる衛星センサが捉えた3つの高解像度リモートセンシング画像に関する数値実験は、deeplab v3+、pspnet、fastfcn、danet、ocrnetなどのベンチマーク手法よりも優れた性能を示している。
関連論文リスト
- BAFNet: Bilateral Attention Fusion Network for Lightweight Semantic Segmentation of Urban Remote Sensing Images [6.153725909241752]
本研究では,高分解能な都市リモートセンシング画像の分割を効率的に行うために,両側注意融合ネットワーク(BAFNet)と呼ばれる軽量なセマンティックセマンティックセマンティクスネットワークを提案する。
BAFNetは高度な軽量モデルを精度で上回るが、2つのデータセット上の非軽量な最先端メソッドに匹敵するパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-09-16T13:25:42Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - DQnet: Cross-Model Detail Querying for Camouflaged Object Detection [54.82390534024954]
カモフラージュされた物体検出のための畳み込みニューラルネットワーク(CNN)は、完全な対象範囲を無視しながら局所的な識別領域を活性化する傾向がある。
本稿では,CNNの内在的特性から部分的活性化が引き起こされることを論じる。
完全なオブジェクト範囲を活性化できる特徴マップを得るために,クロスモデル詳細クエリネットワーク(DQnet)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-16T06:23:58Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - CSRNet: Cascaded Selective Resolution Network for Real-time Semantic
Segmentation [18.63596070055678]
本稿では,リアルタイムセグメンテーションの性能向上を図るために,光カスケード選択分解ネットワーク(CSRNet)を提案する。
提案するネットワークは,低解像度から高解像度までの特徴情報を統合した3段階セグメンテーションシステムを構築している。
2つのよく知られたデータセットの実験により、提案したCSRNetはリアルタイムセグメンテーションの性能を効果的に向上することを示した。
論文 参考訳(メタデータ) (2021-06-08T14:22:09Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Multi-stage Attention ResU-Net for Semantic Segmentation of
Fine-Resolution Remote Sensing Images [9.398340832493457]
この問題に対処するための線形注意機構(LAM)を提案する。
LAMは、計算効率の高いドット積アテンションとほぼ同値である。
微細なリモートセンシング画像からのセマンティックセグメンテーションのためのマルチステージアテンションResU-Netを設計する。
論文 参考訳(メタデータ) (2020-11-29T07:24:21Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z) - Hybrid Multiple Attention Network for Semantic Segmentation in Aerial
Images [24.35779077001839]
グローバルな相関関係を適応的に捉えるために,Hybrid Multiple Attention Network (HMANet) という新しいアテンションベースのフレームワークを提案する。
本稿では,機能的冗長性を低減し,自己注意機構の効率を向上させるため,単純で効果的な領域シャッフルアテンション(RSA)モジュールを提案する。
論文 参考訳(メタデータ) (2020-01-09T07:47:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。