Fugu-MT 論文翻訳(概要): LR-FPN: Enhancing Remote Sensing Object Detection with Location Refined Feature Pyramid Network

論文の概要: LR-FPN: Enhancing Remote Sensing Object Detection with Location Refined Feature Pyramid Network

arxiv url: http://arxiv.org/abs/2404.01614v1
Date: Tue, 2 Apr 2024 03:36:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-03 18:08:16.130318
Title: LR-FPN: Enhancing Remote Sensing Object Detection with Location Refined Feature Pyramid Network
Title（参考訳）: LR-FPN:位置修正型特徴ピラミッドネットワークによるリモートセンシング対象検出の実現
Authors: Hanqian Li, Ruinan Zhang, Ye Pan, Junchi Ren, Fei Shen,
Abstract要約: 浅い位置情報の抽出を促進するために,新しい位置改良型特徴ピラミッドネットワーク(LR-FPN)を提案する。 2つの大規模なリモートセンシングデータセットの実験により、提案したLR-FPNは最先端のオブジェクト検出手法よりも優れていることが示された。
参考スコア（独自算出の注目度）: 2.028685490378346
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Remote sensing target detection aims to identify and locate critical targets within remote sensing images, finding extensive applications in agriculture and urban planning. Feature pyramid networks (FPNs) are commonly used to extract multi-scale features. However, existing FPNs often overlook extracting low-level positional information and fine-grained context interaction. To address this, we propose a novel location refined feature pyramid network (LR-FPN) to enhance the extraction of shallow positional information and facilitate fine-grained context interaction. The LR-FPN consists of two primary modules: the shallow position information extraction module (SPIEM) and the contextual interaction module (CIM). Specifically, SPIEM first maximizes the retention of solid location information of the target by simultaneously extracting positional and saliency information from the low-level feature map. Subsequently, CIM injects this robust location information into different layers of the original FPN through spatial and channel interaction, explicitly enhancing the object area. Moreover, in spatial interaction, we introduce a simple local and non-local interaction strategy to learn and retain the saliency information of the object. Lastly, the LR-FPN can be readily integrated into common object detection frameworks to improve performance significantly. Extensive experiments on two large-scale remote sensing datasets (i.e., DOTAV1.0 and HRSC2016) demonstrate that the proposed LR-FPN is superior to state-of-the-art object detection approaches. Our code and models will be publicly available.
Abstract（参考訳）: リモートセンシングターゲット検出は、リモートセンシング画像内の重要目標を特定し、特定することを目的としており、農業や都市計画に広く応用されている。特徴ピラミッドネットワーク(FPN)は、マルチスケールの特徴を抽出するために一般的に用いられる。しかし、既存のFPNは、低レベルの位置情報ときめ細かいコンテキスト相互作用を抽出するのを見落としていることが多い。そこで本研究では,浅い位置情報を抽出し,きめ細かなコンテキスト相互作用を容易にするために,新しい位置改良型特徴ピラミッドネットワーク(LR-FPN)を提案する。 LR-FPNは、浅い位置情報抽出モジュール(SPIEM)と文脈相互作用モジュール(CIM)の2つの一次モジュールから構成される。具体的には、SPIEMは、まず、低レベル特徴写像から位置情報と塩分情報を同時に抽出することにより、目標の固体位置情報の保持を最大化する。その後、CIMは、空間的およびチャネル的相互作用を通じて、この堅牢な位置情報を元のFPNの異なる層に注入し、対象領域を明示的に拡張する。さらに、空間的相互作用において、オブジェクトの正当性情報を学習し、保持するための単純な局所的および非局所的相互作用戦略を導入する。最後に、LR-FPNは共通のオブジェクト検出フレームワークに容易に統合でき、性能を大幅に向上させることができる。 2つの大規模なリモートセンシングデータセット(DOTAV1.0とHRSC2016)に対する大規模な実験は、提案されたLR-FPNが最先端のオブジェクト検出アプローチよりも優れていることを示した。私たちのコードとモデルは公開されます。

関連論文リスト

Boundary and Position Information Mining for Aerial Small Object Detection [13.886518281829604]
境界・位置情報マイニング(BPIM)フレームワークは,物体のエッジと位置を捉えるために提案されている。 BPIMは、注意機構とクロススケールな特徴融合戦略を用いて、小さな物体検出のための境界情報、位置情報、スケール情報を統合することができる。
論文参考訳（メタデータ） (2026-01-23T10:15:12Z)
LGI-DETR: Local-Global Interaction for UAV Object Detection [0.0]
既存のエンド・ツー・エンドのオブジェクト検出器の多くは自然のシーン用に設計されている。それらを直接UAV画像に適用するのは理想的ではない。 UAVのためのローカル・グローバル情報対話型DETRを設計する。
論文参考訳（メタデータ） (2025-03-24T15:32:49Z)
Cross-Modal Bidirectional Interaction Model for Referring Remote Sensing Image Segmentation [50.433911327489554]
リモートセンシング画像セグメンテーション(RRSIS)の目標は、参照式によって識別された対象オブジェクトの画素レベルマスクを生成することである。上記の課題に対処するため、クロスモーダル双方向相互作用モデル(CroBIM)と呼ばれる新しいRRSISフレームワークが提案されている。 RRSISの研究をさらに推し進めるために、52,472個の画像言語ラベル三重項からなる新しい大規模ベンチマークデータセットRISBenchを構築した。
論文参考訳（メタデータ） (2024-10-11T08:28:04Z)
PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。 PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。 PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文参考訳（メタデータ） (2024-08-26T19:43:01Z)
Mixture-of-Noises Enhanced Forgery-Aware Predictor for Multi-Face Manipulation Detection and Localization [52.87635234206178]
本稿では,多面的操作検出と局所化に適したMoNFAPという新しいフレームワークを提案する。このフレームワークには2つの新しいモジュールが含まれている: Forgery-aware Unified Predictor (FUP) Module と Mixture-of-Noises Module (MNM)。
論文参考訳（メタデータ） (2024-08-05T08:35:59Z)
Multi-Scale Direction-Aware Network for Infrared Small Target Detection [2.661766509317245]
赤外小目標検出は、背景とターゲットを効果的に分離することが難しい問題に直面している。我々は、赤外線小ターゲットの高周波方向特徴を統合するためのマルチスケール方向対応ネットワーク(MSDA-Net)を提案する。 MSDA-Netは、パブリックNUDT-SIRST、SIRST、IRSTD-1kデータセット上で、最先端(SOTA)結果を達成する。
論文参考訳（メタデータ） (2024-06-04T07:23:09Z)
Salient Object Detection in Optical Remote Sensing Images Driven by Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。 3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文参考訳（メタデータ） (2023-09-15T07:14:43Z)
Remote Sensing Cross-Modal Text-Image Retrieval Based on Global and Local Information [15.32353270625554]
リモートセンシング(RS)画像の高速かつ柔軟な情報抽出を可能にするため,クロスモーダルリモートセンシングテキスト画像検索(RSCTIR)は近年,緊急な研究ホットスポットとなっている。まず,グローバル・ローカル情報(GaLR)に基づく新しいRSCTIRフレームワークを提案し,多レベル情報ダイナミックフュージョン(MIDF)モジュールを設計し,異なるレベルの機能を効果的に統合する。公開データセットの実験は、RSCTIRタスク上でのGaLR法の最先端性能を強く実証している。
論文参考訳（メタデータ） (2022-04-21T03:18:09Z)
Learning to Aggregate Multi-Scale Context for Instance Segmentation in Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文参考訳（メタデータ） (2021-11-22T08:55:25Z)
An Attention-Fused Network for Semantic Segmentation of Very-High-Resolution Remote Sensing Imagery [26.362854938949923]
注目融合ネットワーク(AFNet)という,新しい畳み込みニューラルネットワークアーキテクチャを提案する。 ISPRS Vaihingen 2DデータセットとISPRS Potsdam 2Dデータセットで、総精度91.7%、平均F1スコア90.96%の最先端のパフォーマンスを実現します。
論文参考訳（メタデータ） (2021-05-10T06:23:27Z)
Unveiling the Potential of Structure-Preserving for Weakly Supervised Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文参考訳（メタデータ） (2021-03-08T03:04:14Z)
Personal Fixations-Based Object Segmentation with Object Localization and Boundary Preservation [60.41628937597989]
我々はPFOS(Personal Fixations-based Object)に着目し,過去の研究の課題に対処する。視線オブジェクトをセグメント化するオブジェクトローカリゼーションと境界保存(OLBP)に基づく新しいネットワークを提案する。 OLBPは複数のタイプの深い監督の混合されたボトムアップおよびトップダウンの方法で整理されます。
論文参考訳（メタデータ） (2021-01-22T09:20:47Z)
Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文参考訳（メタデータ） (2020-02-25T14:06:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。