論文の概要: RFWNet: A Lightweight Remote Sensing Object Detector Integrating Multiscale Receptive Fields and Foreground Focus Mechanism
- arxiv url: http://arxiv.org/abs/2503.00545v2
- Date: Thu, 03 Jul 2025 14:01:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:13.688676
- Title: RFWNet: A Lightweight Remote Sensing Object Detector Integrating Multiscale Receptive Fields and Foreground Focus Mechanism
- Title(参考訳): RFWNet:マルチスケール受容場と前景焦点機構を統合した軽量リモートセンシングオブジェクト検出器
- Authors: Yujie Lei, Wenjie Sun, Sen Jia, Qingquan Li, Jie Zhang,
- Abstract要約: 本研究では,マルチスケールの受容場とフォアグラウンドの焦点機構を統合した,効率的かつ軽量なRSODアルゴリズムを提案する。
総合的な実験の結果、RFWNetの平均精度は95.3%、平均精度は73.2%に達した。
- 参考スコア(独自算出の注目度): 10.997183129304409
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Challenges in remote sensing object detection(RSOD), such as high interclass similarity, imbalanced foreground-background distribution, and the small size of objects in remote sensing images, significantly hinder detection accuracy. Moreover, the tradeoff between model accuracy and computational complexity poses additional constraints on the application of RSOD algorithms. To address these issues, this study proposes an efficient and lightweight RSOD algorithm integrating multiscale receptive fields and foreground focus mechanism, named robust foreground weighted network(RFWNet). Specifically, we proposed a lightweight backbone network receptive field adaptive selection network (RFASNet), leveraging the rich context information of remote sensing images to enhance class separability. Additionally, we developed a foreground-background separation module(FBSM)consisting of a background redundant information filtering module (BRIFM) and a foreground information enhancement module (FIEM) to emphasize critical regions within images while filtering redundant background information. Finally, we designed a loss function, the weighted CIoU-Wasserstein loss (LWCW),which weights the IoU-based loss by using the normalized Wasserstein distance to mitigate model sensitivity to small object position deviations. The comprehensive experimental results demonstrate that RFWNet achieved 95.3% and 73.2% mean average precision (mAP) with 6.0 M parameters on the DOTA V1.0 and NWPU VHR-10 datasets, respectively, with an inference speed of 52 FPS.
- Abstract(参考訳): リモートセンシングオブジェクト検出(RSOD)の課題は、高いクラス間類似性、不均衡な前地上分布、リモートセンシング画像におけるオブジェクトの小さいサイズなど、検出精度を著しく損なうことである。
さらに、モデル精度と計算複雑性のトレードオフは、RSODアルゴリズムの適用にさらなる制約をもたらす。
これらの問題に対処するために,マルチスケールの受容場と前景重み付きネットワーク(RFWNet)を融合した,効率的かつ軽量なRSODアルゴリズムを提案する。
具体的には、リモートセンシング画像のリッチなコンテキスト情報を活用して、クラス分離性を高める軽量なバックボーンネットワーク受容フィールド適応選択ネットワーク(RFASNet)を提案する。
さらに,背景情報フィルタリングモジュール (BRIFM) と前景情報拡張モジュール (FIEM) から構成される前景背景分離モジュール (FBSM) を開発した。
最後に, モデル感度を小さい物体位置偏差に緩和するために, 正規化ワッサースタイン距離を用いてIoUに基づく損失を重み付けする損失関数CIoU-Wasserstein loss (LWCW) を設計した。
総合的な実験の結果、RFWNetは平均精度(mAP)を95.3%、平均精度(mAP)を6.0MのDOTA V1.0データセットとNWPU VHR-10データセットで達成し、推定速度は52FPSであった。
関連論文リスト
- LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection [18.804394986840887]
LEGNetは、低品質のリモートセンシング画像のための新しいエッジ・ガウスアグリゲーションモジュールを組み込んだ軽量ネットワークである。
我々の重要な革新は、Scharr演算子に基づくエッジ事前の相乗的統合と不確実性を考慮したガウス的モデリングである。
LEGNetは、計算効率を確保しながら、5つのベンチマークデータセットにわたる最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-18T08:20:24Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Hi-ResNet: Edge Detail Enhancement for High-Resolution Remote Sensing Segmentation [10.919956120261539]
高分解能リモートセンシング(HRS)セマンティックセマンティクスは、高分解能カバレッジ領域からキーオブジェクトを抽出する。
HRS画像内の同じカテゴリのオブジェクトは、多様な地理的環境におけるスケールと形状の顕著な違いを示す。
効率的なネットワーク構造を持つ高分解能リモートセンシングネットワーク(Hi-ResNet)を提案する。
論文 参考訳(メタデータ) (2023-05-22T03:58:25Z) - Near-filed SAR Image Restoration with Deep Learning Inverse Technique: A
Preliminary Study [5.489791364472879]
近接場合成開口レーダ(SAR)は、ターゲットの散乱分布ホットスポットの高解像度画像を提供する。
一方、撮像の結果は、サイドローブ、クラッタ、ノイズから必然的に劣化する。
イメージを復元するために、現在の手法では、例えば、点拡散関数(PSF)は空間的に一貫したものであり、ターゲットはスパース点散乱器などで構成されている。
我々は、分解モデルを空間的に可変な複素畳み込みモデルに再構成し、近接場SARのシステム応答を考慮した。
モデルに基づくディープラーニングネットワークは、復元するために設計されている
論文 参考訳(メタデータ) (2022-11-28T01:28:33Z) - Pyramid Grafting Network for One-Stage High Resolution Saliency
Detection [29.013012579688347]
我々は、異なる解像度画像から特徴を独立して抽出する、Praamid Grafting Network (PGNet) と呼ばれるワンステージフレームワークを提案する。
CNNブランチが壊れた詳細情報をよりホモロジーに組み合わせられるように、アテンションベースのクロスモデルグラフティングモジュール (CMGM) が提案されている。
我々は,4K-8K解像度で5,920個の画像を含む超高分解能塩度検出データセットUHRSDを新たに提供した。
論文 参考訳(メタデータ) (2022-04-11T12:22:21Z) - Context-Preserving Instance-Level Augmentation and Deformable
Convolution Networks for SAR Ship Detection [50.53262868498824]
ランダムな方向と部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。
ターゲット内の部分的な情報損失に頑健なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2022-02-14T07:01:01Z) - Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images [15.404024559652534]
本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
論文 参考訳(メタデータ) (2021-12-13T14:37:20Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - A Light-Weight Object Detection Framework with FPA Module for Optical
Remote Sensing Imagery [12.762588615997624]
本稿では,効率的なアンカーフリー物体検出器CenterFPANetを提案する。
速度を追求するために、軽量なバックボーンを使用し、非対称な革命ブロックを導入する。
この戦略は、検出速度を低下させることなく、リモートセンシング画像オブジェクト検出の精度を向上させることができる。
論文 参考訳(メタデータ) (2020-09-07T12:41:17Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z) - A Single Stream Network for Robust and Real-time RGB-D Salient Object
Detection [89.88222217065858]
我々は、深度マップを用いて、RGBと深度の間の早期融合と中核融合を誘導する単一ストリームネットワークを設計する。
このモデルは、現在の最も軽量なモデルよりも55.5%軽く、32 FPSのリアルタイム速度で384倍の384ドルの画像を処理している。
論文 参考訳(メタデータ) (2020-07-14T04:40:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。