論文の概要: Enhancing Satellite Object Localization with Dilated Convolutions and Attention-aided Spatial Pooling
- arxiv url: http://arxiv.org/abs/2505.05599v1
- Date: Thu, 08 May 2025 18:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-12 20:40:10.056473
- Title: Enhancing Satellite Object Localization with Dilated Convolutions and Attention-aided Spatial Pooling
- Title(参考訳): 拡張畳み込みと注意支援型空間プールによる衛星物体位置決めの強化
- Authors: Seraj Al Mahmud Mostafa, Chenxi Wang, Jia Yue, Yuta Hozumi, Jianwu Wang,
- Abstract要約: 本研究は, 上部大気重力波(GW), 中間圏ボーレス(Bore), 海洋渦(OE)の3つの衛星データセットに焦点を当てた。
YOLO-DCAPは、複雑なシナリオにおけるオブジェクトのローカライゼーションを改善するために設計された、YOLOv5の新たな拡張バージョンである。
実験の結果, YOLO-DCAPは, YOLOベースモデルと最先端アプローチの両方で有意に優れていた。
- 参考スコア(独自算出の注目度): 3.594374574210654
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object localization in satellite imagery is particularly challenging due to the high variability of objects, low spatial resolution, and interference from noise and dominant features such as clouds and city lights. In this research, we focus on three satellite datasets: upper atmospheric Gravity Waves (GW), mesospheric Bores (Bore), and Ocean Eddies (OE), each presenting its own unique challenges. These challenges include the variability in the scale and appearance of the main object patterns, where the size, shape, and feature extent of objects of interest can differ significantly. To address these challenges, we introduce YOLO-DCAP, a novel enhanced version of YOLOv5 designed to improve object localization in these complex scenarios. YOLO-DCAP incorporates a Multi-scale Dilated Residual Convolution (MDRC) block to capture multi-scale features at scale with varying dilation rates, and an Attention-aided Spatial Pooling (AaSP) module to focus on the global relevant spatial regions, enhancing feature selection. These structural improvements help to better localize objects in satellite imagery. Experimental results demonstrate that YOLO-DCAP significantly outperforms both the YOLO base model and state-of-the-art approaches, achieving an average improvement of 20.95% in mAP50 and 32.23% in IoU over the base model, and 7.35% and 9.84% respectively over state-of-the-art alternatives, consistently across all three satellite datasets. These consistent gains across all three satellite datasets highlight the robustness and generalizability of the proposed approach. Our code is open sourced at https://github.com/AI-4-atmosphere-remote-sensing/satellite-object-localization.
- Abstract(参考訳): 衛星画像における物体の局所化は、物体の高可変性、空間分解能の低さ、ノイズからの干渉、雲や街灯のような支配的な特徴のために特に困難である。
本研究では,上層大気重力波(GW),中圏ボレス(Bore),海洋渦(Ocean Eddies,OE)の3つの衛星データセットに着目し,それぞれ独自の課題を提示する。
これらの課題には、関心のあるオブジェクトのサイズ、形状、特徴範囲が著しく異なるような、主要なオブジェクトパターンのスケールと出現のばらつきが含まれる。
これらの課題に対処するために、複雑なシナリオにおけるオブジェクトのローカライゼーションを改善するために設計されたYOLO-DCAP、YOLO-DCAPを紹介します。
YOLO-DCAPにはMDRC(Multi-scale Dilated Residual Convolution)ブロックが組み込まれており、様々な拡張レートで大規模に複数の特徴を捉えることができる。
これらの構造的改善は、衛星画像中の物体のローカライズを改善するのに役立つ。
実験の結果、YOLO-DCAPはYOLOベースモデルと最先端のアプローチの両方を大きく上回り、ベースモデルよりも平均20.95%のmAP50と32.23%のIoU、それぞれ7.35%と9.84%の改善を達成している。
これら3つの衛星データセット間の一貫した利得は、提案手法の堅牢性と一般化性を浮き彫りにする。
我々のコードはhttps://github.com/AI-4-atmosphere-remote-sensing/satellite-object-localizationで公開されている。
関連論文リスト
- EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation [50.433911327489554]
制御可能な衛星マップ翻訳のための新しいフレームワークであるEarthMapperを紹介する。
また,中国38都市を対象とした302,132組の衛星マップからなる大規模データセットであるCNSatMapをコントリビュートした。
CNSatMapとNew Yorkデータセットの実験は、EarthMapperの優れたパフォーマンスを実証している。
論文 参考訳(メタデータ) (2025-04-28T02:41:12Z) - Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。
EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。
本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文 参考訳(メタデータ) (2025-04-09T15:13:26Z) - Referring Remote Sensing Image Segmentation via Bidirectional Alignment Guided Joint Prediction [7.8862197224709805]
私たちのフレームワークは、視覚と言語の間のギャップを埋め、マルチスケールの機能相互作用を強化し、オブジェクトの微粒化を改善するために設計された新しいフレームワークです。
ベンチマークデータセットであるRefSegRSとRRSIS-Dの実験は、我々の成果が最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-02-12T15:21:18Z) - Localization, balance and affinity: a stronger multifaceted collaborative salient object detector in remote sensing images [24.06927394483275]
ORSIにおいて,LBA-MCNetと呼ばれる,より強力な多面協調型サリエント物体検出器を提案する。
このネットワークは、ターゲットの正確な位置決め、詳細な機能のバランス、画像レベルのグローバルコンテキスト情報のモデリングに重点を置いている。
論文 参考訳(メタデータ) (2024-10-31T14:50:48Z) - Spatial Transformer Network YOLO Model for Agricultural Object Detection [0.3124884279860061]
本稿では,空間変換器ネットワーク(STN)をYOLOに統合し,性能を向上させる手法を提案する。
提案するSTN-YOLOは,画像の重要な領域に着目し,モデルの有効性を高めることを目的としている。
農業オブジェクト検出のためのベンチマークデータセットと、最先端の植物表現型温室施設からの新たなデータセットにSTN-YOLOを適用した。
論文 参考訳(メタデータ) (2024-07-31T14:53:41Z) - Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks [82.82866901799565]
我々は,都市間セマンティックセマンティックセグメンテーションタスクの研究を目的とした,新しいマルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を構築した。
単一都市に留まらず,多都市環境からAIモデルの一般化能力を促進するため,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは, 並列高分解能融合方式で, 都市景観の空間的トポロジカルな構造を良好に維持することができる。
論文 参考訳(メタデータ) (2023-09-26T23:55:39Z) - Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - DAM-Net: Global Flood Detection from SAR Imagery Using Differential
Attention Metric-Based Vision Transformers [22.885444177106873]
高分解能合成開口レーダ(SAR)画像を用いた浸水領域の検出は危機管理や災害管理における重要な課題である。
そこで本研究では,新しいディファレンシャル・アテンション・メトリック・ベース・ネットワーク(DAM-Net)を提案する。
DAM-Netは、多時間画像のマルチスケールな変化特徴を得るためのウェイトシェアリングシームスバックボーンと、水体変化の高レベルな意味情報を含むトークンの2つのキーコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-06-01T14:12:33Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。