論文の概要: BAFNet: Bilateral Attention Fusion Network for Lightweight Semantic Segmentation of Urban Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2409.10269v1
- Date: Mon, 16 Sep 2024 13:25:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-17 15:30:17.001996
- Title: BAFNet: Bilateral Attention Fusion Network for Lightweight Semantic Segmentation of Urban Remote Sensing Images
- Title(参考訳): BAFNet:都市リモートセンシング画像の軽量セマンティックセマンティックセグメンテーションのためのバイラテラルアテンションフュージョンネットワーク
- Authors: Wentao Wang, Xili Wang,
- Abstract要約: 本研究では,高分解能な都市リモートセンシング画像の分割を効率的に行うために,両側注意融合ネットワーク(BAFNet)と呼ばれる軽量なセマンティックセマンティックセマンティクスネットワークを提案する。
BAFNetは高度な軽量モデルを精度で上回るが、2つのデータセット上の非軽量な最先端メソッドに匹敵するパフォーマンスを示す。
- 参考スコア(独自算出の注目度): 6.153725909241752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-scale semantic segmentation networks often achieve high performance, while their application can be challenging when faced with limited sample sizes and computational resources. In scenarios with restricted network size and computational complexity, models encounter significant challenges in capturing long-range dependencies and recovering detailed information in images. We propose a lightweight bilateral semantic segmentation network called bilateral attention fusion network (BAFNet) to efficiently segment high-resolution urban remote sensing images. The model consists of two paths, namely dependency path and remote-local path. The dependency path utilizes large kernel attention to acquire long-range dependencies in the image. Besides, multi-scale local attention and efficient remote attention are designed to construct remote-local path. Finally, a feature aggregation module is designed to effectively utilize the different features of the two paths. Our proposed method was tested on public high-resolution urban remote sensing datasets Vaihingen and Potsdam, with mIoU reaching 83.20% and 86.53%, respectively. As a lightweight semantic segmentation model, BAFNet not only outperforms advanced lightweight models in accuracy but also demonstrates comparable performance to non-lightweight state-of-the-art methods on two datasets, despite a tenfold variance in floating-point operations and a fifteenfold difference in network parameters.
- Abstract(参考訳): 大規模セマンティックセグメンテーションネットワークは、しばしば高い性能を達成するが、サンプルサイズや計算資源の制限に直面した場合、その応用は困難である。
制限されたネットワークサイズと計算複雑性のシナリオでは、モデルは長距離依存関係をキャプチャし、画像の詳細な情報を復元する上で大きな課題に直面する。
本稿では,高分解能な都市リモートセンシング画像の分割を効率的に行うために,BAFNetと呼ばれる軽量な2国間セマンティックセマンティックセマンティクスネットワークを提案する。
モデルは2つのパス、すなわち依存性パスとリモートローカルパスで構成される。
依存関係パスは、イメージ内の長距離依存関係を取得するために、カーネルの注意を利用する。
また,マルチスケールのローカル・アテンションと効率的なリモート・アテンションは,リモート・ローカル・パスを構築するために設計されている。
最後に、機能集約モジュールは、2つのパスの異なる特徴を効果的に活用するように設計されている。
提案手法は,公共の高解像度都市リモートセンシングデータセットであるヴァイヒンゲンとポツダムで,mIoUはそれぞれ83.20%,86.53%に達した。
軽量セマンティックセグメンテーションモデルとして、BAFNetは高度な軽量モデルよりも精度が高く、浮動小数点演算の10倍のばらつきとネットワークパラメータの15倍の違いにもかかわらず、2つのデータセット上の非軽量な最先端手法に匹敵する性能を示す。
関連論文リスト
- Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - Lightweight Salient Object Detection in Optical Remote-Sensing Images
via Semantic Matching and Edge Alignment [61.45639694373033]
セマンティックマッチングとエッジアライメントに基づく光リモートセンシング画像(ORSI-SOD)のための新しい軽量ネットワークSeaNetを提案する。
具体的には、機能抽出のための軽量MobileNet-V2、高レベルの機能のための動的セマンティックマッチングモジュール(DSMM)、推論のためのポータブルデコーダが含まれる。
論文 参考訳(メタデータ) (2023-01-07T04:33:51Z) - DPNet: Dual-Path Network for Real-time Object Detection with Lightweight
Attention [15.360769793764526]
本稿では,リアルタイム物体検出のための軽量アテンション方式を用いて,DPNetというデュアルパスネットワークを提案する。
DPNetは、検出精度と実装効率の間の最先端のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-09-28T09:11:01Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - DPNET: Dual-Path Network for Efficient Object Detectioj with Lightweight
Self-Attention [16.13989397708127]
DPNetは、軽量な自己注意を伴う効率的なオブジェクト検出のためのデュアルパスネットワークである。
COCOデータセットでは29.0%のAPを達成し、320x320の画像に対して1.14 GFLOPと2.27Mモデルサイズしか達成していない。
論文 参考訳(メタデータ) (2021-10-31T13:38:16Z) - EPMF: Efficient Perception-aware Multi-sensor Fusion for 3D Semantic Segmentation [62.210091681352914]
自律運転やロボティクスなど,多くのアプリケーションを対象とした3次元セマンティックセマンティックセグメンテーションのためのマルチセンサフュージョンについて検討する。
本研究では,知覚認識型マルチセンサフュージョン(PMF)と呼ばれる協調融合方式について検討する。
本稿では,2つのモードから特徴を分離して抽出する2ストリームネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-21T10:47:26Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z) - Multi-Attention-Network for Semantic Segmentation of Fine Resolution
Remote Sensing Images [10.835342317692884]
リモートセンシング画像におけるセマンティックセグメンテーションの精度は、ディープ畳み込みニューラルネットワークによって著しく向上した。
本稿では,これらの問題に対処するマルチアテンション・ネットワーク(MANet)を提案する。
線形複雑性を伴うカーネル注意の新たなアテンション機構が提案され,注目される計算負荷の低減が図られた。
論文 参考訳(メタデータ) (2020-09-03T09:08:02Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Multi-scale Interaction for Real-time LiDAR Data Segmentation on an
Embedded Platform [62.91011959772665]
LiDARデータのリアルタイムセマンティックセグメンテーションは、自動運転車にとって不可欠である。
ポイントクラウド上で直接動作する現在のアプローチでは、複雑な空間集約操作を使用する。
本稿では,マルチスケールインタラクションネットワーク(MINet)と呼ばれるプロジェクションベースの手法を提案する。
論文 参考訳(メタデータ) (2020-08-20T19:06:11Z) - A novel Deep Structure U-Net for Sea-Land Segmentation in Remote Sensing
Images [30.39131853354783]
本稿では,Residual Dense U-Net (RDU-Net) を用いた画素ワイド海面分割のための新しいディープニューラルネットワーク構造を提案する。
RDU-Netは、十分な結果を得るために、ダウンサンプリングとアップサンプリングの2つのパスの組み合わせである。
論文 参考訳(メタデータ) (2020-03-17T16:00:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。