論文の概要: M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for Optical-SAR Fusion Object Detection
- arxiv url: http://arxiv.org/abs/2505.10931v1
- Date: Fri, 16 May 2025 07:10:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:14.203011
- Title: M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for Optical-SAR Fusion Object Detection
- Title(参考訳): M4-SAR:光SAR融合物体検出のためのマルチ解像度・マルチポーラライゼーション・マルチシーン・マルチソースデータセットとベンチマーク
- Authors: Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei Luo,
- Abstract要約: 光またはSAR画像を用いた単一ソースリモートセンシングオブジェクト検出は複雑な環境では困難である。
マルチレゾリューション,マルチポーラライゼーション,マルチシーン,マルチソースSARデータセット(M4-SAR)という,光SAR融合オブジェクト検出のための最初の包括的データセットを提案する。
標準化された評価を実現するため、6つの最先端マルチソース融合手法を統合する統一ベンチマークツールキットを開発した。
- 参考スコア(独自算出の注目度): 28.405249208866067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-source remote sensing object detection using optical or SAR images struggles in complex environments. Optical images offer rich textural details but are often affected by low-light, cloud-obscured, or low-resolution conditions, reducing the detection performance. SAR images are robust to weather, but suffer from speckle noise and limited semantic expressiveness. Optical and SAR images provide complementary advantages, and fusing them can significantly improve the detection accuracy. However, progress in this field is hindered by the lack of large-scale, standardized datasets. To address these challenges, we propose the first comprehensive dataset for optical-SAR fusion object detection, named Multi-resolution, Multi-polarization, Multi-scene, Multi-source SAR dataset (M4-SAR). It contains 112,184 precisely aligned image pairs and nearly one million labeled instances with arbitrary orientations, spanning six key categories. To enable standardized evaluation, we develop a unified benchmarking toolkit that integrates six state-of-the-art multi-source fusion methods. Furthermore, we propose E2E-OSDet, a novel end-to-end multi-source fusion detection framework that mitigates cross-domain discrepancies and establishes a robust baseline for future studies. Extensive experiments on M4-SAR demonstrate that fusing optical and SAR data can improve $mAP$ by 5.7\% over single-source inputs, with particularly significant gains in complex environments. The dataset and code are publicly available at https://github.com/wchao0601/M4-SAR.
- Abstract(参考訳): 光またはSAR画像を用いた単一ソースリモートセンシングオブジェクト検出は複雑な環境では困難である。
光画像はリッチなテクスチュラルな詳細を提供するが、しばしば低照度、曇り、低解像度の条件に影響され、検出性能が低下する。
SAR画像は天候に強いが、スペックルノイズや意味表現性に悩まされている。
光とSAR画像は相補的な利点をもたらし、それらを融合させることで検出精度を大幅に向上させることができる。
しかし、この分野の進歩は、大規模で標準化されたデータセットの欠如によって妨げられている。
これらの課題に対処するため、光SAR融合オブジェクト検出のための最初の包括的データセット、M4-SAR、M4-SAR、Multi-SARを提案する。
112,184枚の正確に整列されたイメージペアと、任意の方向を持つ100万近いラベル付きインスタンスが含まれており、6つの主要なカテゴリにまたがっている。
標準化された評価を実現するため、6つの最先端マルチソース融合手法を統合する統一ベンチマークツールキットを開発した。
E2E-OSDetは、ドメイン間の差異を緩和し、将来の研究の強固なベースラインを確立する、新しいエンドツーエンドのマルチソースフュージョン検出フレームワークである。
M4-SARに関する大規模な実験は、光とSARデータを融合させることでシングルソース入力よりも$mAP$が5.7 %向上し、複雑な環境では特に顕著な利得が得られることを示した。
データセットとコードはhttps://github.com/wchao0601/M4-SARで公開されている。
関連論文リスト
- Multi-Resolution SAR and Optical Remote Sensing Image Registration Methods: A Review, Datasets, and Future Perspectives [13.749888089968373]
リモートセンシングデータ融合には合成開口レーダ(SAR)と光画像登録が不可欠である。
画像の解像度が向上するにつれて、微細なSARテクスチャがより重要になり、アライメントの問題と3次元空間の相違が生じる。
MultiResSARデータセットは10万組以上のマルチソース、マルチ解像度、マルチシーンSARおよび光学画像を含む。
論文 参考訳(メタデータ) (2025-02-03T02:51:30Z) - Text-Guided Coarse-to-Fine Fusion Network for Robust Remote Sensing Visual Question Answering [26.8129265632403]
現在のリモートセンシング視覚質問応答(RSVQA)法は,光学センサの撮像機構によって制限されている。
RSVQAの性能を向上させるために,テキスト誘導型粗結合ネットワーク(TGFNet)を提案する。
我々は、光学SAR RSVQA法を評価するための最初の大規模ベンチマークデータセットを作成する。
論文 参考訳(メタデータ) (2024-11-24T09:48:03Z) - Scaling Efficient Masked Image Modeling on Large Remote Sensing Dataset [66.15872913664407]
本稿では、大規模RSデータセットの作成とMIMの効率的なアプローチを特徴とする、RSモデルのための新しい事前学習パイプラインを提案する。
我々は、利用可能なRSデータセットを収集し、排他的、スライシング、復号化を通じてそれらを処理することで、OptoRS-13Mという高品質なデータセットをキュレートした。
実験により,OCR-13Mは分類,検出,セグメンテーション性能を著しく向上し,SelectiveMAEは2回以上のトレーニング効率を向上させることが示された。
論文 参考訳(メタデータ) (2024-06-17T15:41:57Z) - 3MOS: Multi-sources, Multi-resolutions, and Multi-scenes dataset for Optical-SAR image matching [6.13702551312774]
光SAR画像マッチングのための大規模マルチソース、マルチ解像度、マルチシーンデータセット(3MOS)を紹介する。
6つの商用衛星からのSARデータを含む155Kの光学SAR画像対で構成され、解像度は1.25mから12.5mである。
データは、都市、農村、平野、丘、山、水、砂漠、凍った土を含む8つのシーンに分類されている。
論文 参考訳(メタデータ) (2024-04-01T00:31:11Z) - SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - Searching a Compact Architecture for Robust Multi-Exposure Image Fusion [55.37210629454589]
2つの大きなスタブリングブロックは、画素の不一致や非効率な推論など、開発を妨げる。
本研究では,高機能なマルチ露光画像融合のための自己アライメントとディテールリプレクションモジュールを取り入れたアーキテクチャ検索に基づくパラダイムを提案する。
提案手法は様々な競争方式より優れており、一般的なシナリオではPSNRが3.19%向上し、不整合シナリオでは23.5%向上した。
論文 参考訳(メタデータ) (2023-05-20T17:01:52Z) - A lightweight multi-scale context network for salient object detection
in optical remote sensing images [16.933770557853077]
光学RSIにおける有能な物体検出のためのマルチスケールコンテキストネットワークMSCNetを提案する。
具体的には、有能なオブジェクトのスケール変動に対処するために、マルチスケールコンテキスト抽出モジュールを採用する。
複雑な背景の完全正当性オブジェクトを正確に検出するために,注意に基づくピラミッド特徴集約機構を設計する。
論文 参考訳(メタデータ) (2022-05-18T14:32:47Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。