論文の概要: LWGANet: A Lightweight Group Attention Backbone for Remote Sensing Visual Tasks
- arxiv url: http://arxiv.org/abs/2501.10040v1
- Date: Fri, 17 Jan 2025 08:56:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-20 13:59:39.039297
- Title: LWGANet: A Lightweight Group Attention Backbone for Remote Sensing Visual Tasks
- Title(参考訳): LWGANet: リモートセンシングビジュアルタスクのための軽量グループ注意バックボーン
- Authors: Wei Lu, Si-Bao Chen, Chris H. Q. Ding, Jin Tang, Bin Luo,
- Abstract要約: この記事では、RS視覚タスクに適した専用の軽量バックボーンネットワークであるLWGANetを紹介する。
RS画像用に調整されたLWGAモジュールは、冗長な特徴を利用して幅広い空間情報を抽出する。
その結果、LWGANetの広範な適用性と、高性能と低複雑性の最適なバランスを維持する能力が確認された。
- 参考スコア(独自算出の注目度): 20.924609707499915
- License:
- Abstract: Remote sensing (RS) visual tasks have gained significant academic and practical importance. However, they encounter numerous challenges that hinder effective feature extraction, including the detection and recognition of multiple objects exhibiting substantial variations in scale within a single image. While prior dual-branch or multi-branch architectural strategies have been effective in managing these object variances, they have concurrently resulted in considerable increases in computational demands and parameter counts. Consequently, these architectures are rendered less viable for deployment on resource-constrained devices. Contemporary lightweight backbone networks, designed primarily for natural images, frequently encounter difficulties in effectively extracting features from multi-scale objects, which compromises their efficacy in RS visual tasks. This article introduces LWGANet, a specialized lightweight backbone network tailored for RS visual tasks, incorporating a novel lightweight group attention (LWGA) module designed to address these specific challenges. LWGA module, tailored for RS imagery, adeptly harnesses redundant features to extract a wide range of spatial information, from local to global scales, without introducing additional complexity or computational overhead. This facilitates precise feature extraction across multiple scales within an efficient framework.LWGANet was rigorously evaluated across twelve datasets, which span four crucial RS visual tasks: scene classification, oriented object detection, semantic segmentation, and change detection. The results confirm LWGANet's widespread applicability and its ability to maintain an optimal balance between high performance and low complexity, achieving SOTA results across diverse datasets. LWGANet emerged as a novel solution for resource-limited scenarios requiring robust RS image processing capabilities.
- Abstract(参考訳): リモートセンシング(RS)視覚タスクは、学術的および実践的に重要な意味を持つようになった。
しかし、複数の物体の検出と認識など、効果的な特徴抽出を妨げる多くの課題に直面している。
従来のデュアルブランチやマルチブランチのアーキテクチャ戦略は、これらのオブジェクトの分散を管理するのに効果的であったが、同時に計算要求やパラメータ数も大幅に増加した。
その結果、これらのアーキテクチャは、リソース制約のあるデバイスへのデプロイでは、あまり有効ではない。
主に自然画像用に設計された現代の軽量バックボーンネットワークは、RS視覚タスクにおけるそれらの有効性を損なうような、マルチスケールオブジェクトから機能を効果的に抽出することの難しさにしばしば遭遇する。
本稿では、RS視覚タスクに適した軽量バックボーンネットワークであるLWGANetを紹介し、これらの課題に対処するために設計された新しい軽量グループアテンション(LWGA)モジュールを組み込む。
RS画像用に調整されたLWGAモジュールは、余分な特徴を活用して、さらなる複雑さや計算オーバーヘッドを導入することなく、ローカルからグローバルスケールまで幅広い空間情報を抽出する。
LWGANetは、シーン分類、オブジェクト指向オブジェクト検出、セマンティックセグメンテーション、変更検出の4つの重要な視覚タスクにまたがる12のデータセットで厳格に評価された。
結果は、LWGANetの広範な適用性と、ハイパフォーマンスと低複雑性の最適なバランスを維持する能力を確認し、多様なデータセットでSOTA結果を達成する。
LWGANetは、堅牢なRS画像処理機能を必要とするリソース制限シナリオのための新しいソリューションとして登場した。
関連論文リスト
- Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - ESDMR-Net: A Lightweight Network With Expand-Squeeze and Dual Multiscale
Residual Connections for Medical Image Segmentation [7.921517156237902]
本稿では,拡張型マルチスケール残差ネットワーク(ESDMR-Net)を提案する。
完全な畳み込みネットワークであり、モバイルデバイスのようなリソースに制約のあるコンピューティングハードウェアに適している。
5つの異なる応用例から7つのデータセットについて実験を行った。
論文 参考訳(メタデータ) (2023-12-17T02:15:49Z) - A lightweight multi-scale context network for salient object detection
in optical remote sensing images [16.933770557853077]
光学RSIにおける有能な物体検出のためのマルチスケールコンテキストネットワークMSCNetを提案する。
具体的には、有能なオブジェクトのスケール変動に対処するために、マルチスケールコンテキスト抽出モジュールを採用する。
複雑な背景の完全正当性オブジェクトを正確に検出するために,注意に基づくピラミッド特徴集約機構を設計する。
論文 参考訳(メタデータ) (2022-05-18T14:32:47Z) - Vision Transformer with Convolutions Architecture Search [72.70461709267497]
本稿では,畳み込み型アーキテクチャサーチ(VTCAS)を用いたアーキテクチャ探索手法を提案する。
VTCASによって探索された高性能バックボーンネットワークは、畳み込みニューラルネットワークの望ましい特徴をトランスフォーマーアーキテクチャに導入する。
これは、特に低照度屋内シーンにおいて、物体認識のためのニューラルネットワークの堅牢性を高める。
論文 参考訳(メタデータ) (2022-03-20T02:59:51Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - MPRNet: Multi-Path Residual Network for Lightweight Image Super
Resolution [2.3576437999036473]
軽量SRにおけるSOTA性能を向上させる軽量超解像ネットワークを提案する。
提案アーキテクチャには新たなアテンション機構であるTwo-Fold Attention Moduleが含まれており,モデルの表現能力を最大化することができる。
論文 参考訳(メタデータ) (2020-11-09T17:11:15Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z) - ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。
我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文 参考訳(メタデータ) (2020-04-19T20:40:31Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。