論文の概要: MODA: The First Challenging Benchmark for Multispectral Object Detection in Aerial Images
- arxiv url: http://arxiv.org/abs/2512.09489v1
- Date: Wed, 10 Dec 2025 10:07:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.476746
- Title: MODA: The First Challenging Benchmark for Multispectral Object Detection in Aerial Images
- Title(参考訳): MODA:空中画像におけるマルチスペクトル物体検出のための最初のチェアベンチマーク
- Authors: Shuaihao Han, Tingfa Xu, Peifu Liu, Jianan Li,
- Abstract要約: 航空画像におけるマルチスペクトル物体検出のための最初の大規模データセット(MODA)を紹介する。
このデータセットは14,041のMSIと330,191のアノテーションで構成されている。
我々はまた、スペクトル情報と空間情報をオブジェクト認識キューに統合するフレームワークであるOSSDetを提案する。
- 参考スコア(独自算出の注目度): 26.48439423478357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aerial object detection faces significant challenges in real-world scenarios, such as small objects and extensive background interference, which limit the performance of RGB-based detectors with insufficient discriminative information. Multispectral images (MSIs) capture additional spectral cues across multiple bands, offering a promising alternative. However, the lack of training data has been the primary bottleneck to exploiting the potential of MSIs. To address this gap, we introduce the first large-scale dataset for Multispectral Object Detection in Aerial images (MODA), which comprises 14,041 MSIs and 330,191 annotations across diverse, challenging scenarios, providing a comprehensive data foundation for this field. Furthermore, to overcome challenges inherent to aerial object detection using MSIs, we propose OSSDet, a framework that integrates spectral and spatial information with object-aware cues. OSSDet employs a cascaded spectral-spatial modulation structure to optimize target perception, aggregates spectrally related features by exploiting spectral similarities to reinforce intra-object correlations, and suppresses irrelevant background via object-aware masking. Moreover, cross-spectral attention further refines object-related representations under explicit object-aware guidance. Extensive experiments demonstrate that OSSDet outperforms existing methods with comparable parameters and efficiency.
- Abstract(参考訳): 空中物体検出は、小さな物体や広い背景干渉のような現実世界のシナリオにおいて重大な課題に直面しており、識別情報が不十分なRGBベースの検出器の性能を制限している。
マルチスペクトル画像(MSI)は、複数のバンドにまたがる新たなスペクトルの手がかりを捉え、有望な代替手段を提供する。
しかし、トレーニングデータの欠如は、MSIの可能性を活用するための主要なボトルネックとなっている。
このギャップに対処するために,14,041のMSIと330,191のアノテーションを多種多様な難題に適用したMODA(Multispectral Object Detection in Aerial Image)の最初の大規模データセットを導入し,この分野の包括的データ基盤を提供する。
さらに,MSIを用いた空中物体検出に固有の課題を克服するために,スペクトル情報と空間情報をオブジェクト認識キューに統合するOSSDetを提案する。
OSSDetは、ターゲット知覚を最適化するためにカスケードされたスペクトル空間変調構造を使用し、スペクトル類似性を利用してオブジェクト内相関を強化し、オブジェクト認識マスキングを通じて無関係な背景を抑えることでスペクトル関連の特徴を集約する。
さらに、クロススペクトルアテンションは、明示的なオブジェクト認識誘導の下でオブジェクト関連表現をさらに洗練する。
大規模な実験では、OSSDetは既存のメソッドを同等のパラメータと効率で上回っている。
関連論文リスト
- AuxDet: Auxiliary Metadata Matters for Omni-Domain Infrared Small Target Detection [49.81255045696323]
補助メタデータ駆動型赤外小型ターゲット検出器(AuxDet)について述べる。
AuxDetはメタデータセマンティクスと視覚的特徴を統合し、各サンプルに対する適応表現学習を導く。
挑戦的なWideIRSTD-Fullベンチマークの実験は、AuxDetが一貫して最先端のメソッドより優れていることを示した。
論文 参考訳(メタデータ) (2025-05-21T07:02:05Z) - Hyperspectral Adapter for Object Tracking based on Hyperspectral Video [18.77789707539318]
本研究では,新しいハイパースペクトル物体追跡手法であるハイパースペクトル追跡用アダプタ(HyA-T)を提案する。
提案手法は、スペクトル情報の損失を防止するため、ハイパースペクトル画像から直接スペクトル情報を抽出する。
HyA-Tはすべてのデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-28T07:31:48Z) - Spectrum-oriented Point-supervised Saliency Detector for Hyperspectral Images [13.79887292039637]
ハイパースペクトル・サリエント物体検出(HSOD)における点監督について紹介する。
本稿では,従来のHSOD法から派生したスペクトル・サリエンシを,そのフレームワーク内で重要なスペクトル表現として組み込む。
本稿では,HSIに特化して設計された新しいパイプラインを提案し,点監督戦略に関連した性能低下を効果的に軽減する。
論文 参考訳(メタデータ) (2024-12-24T02:52:43Z) - Optimizing Multispectral Object Detection: A Bag of Tricks and Comprehensive Benchmarks [49.84182981950623]
RGBおよびTIR(熱赤外)変調を利用したマルチスペクトル物体検出は,課題として広く認識されている。
モダリティと堅牢な融合戦略の両方から特徴を効果的に抽出するだけでなく、スペクトルの相違といった問題に対処する能力も必要である。
本稿では,高パフォーマンス単一モードモデルのシームレスな最適化が可能な,効率的かつ容易にデプロイ可能なマルチスペクトルオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:18:39Z) - SSF-Net: Spatial-Spectral Fusion Network with Spectral Angle Awareness for Hyperspectral Object Tracking [21.664141982246598]
ハイパースペクトルビデオ(HSV)は、空間的、スペクトル的、時間的情報を同時に提供する。
既存の手法は主にバンド再編成に重点を置いており、特徴抽出のためにRGBトラッカーに依存している。
本稿では、超スペクトル(HS)物体追跡において、スペクトル角認識(SST-Net)を用いた空間-スペクトル融合ネットワークを提案する。
論文 参考訳(メタデータ) (2024-03-09T09:37:13Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - Object Detection in Hyperspectral Image via Unified Spectral-Spatial
Feature Aggregation [55.9217962930169]
S2ADetは、高スペクトル画像に固有の豊富なスペクトル情報と空間補完情報を利用する物体検出器である。
S2ADetは既存の最先端メソッドを超え、堅牢で信頼性の高い結果を達成する。
論文 参考訳(メタデータ) (2023-06-14T09:01:50Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。