論文の概要: SPMamba-YOLO: An Underwater Object Detection Network Based on Multi-Scale Feature Enhancement and Global Context Modeling
- arxiv url: http://arxiv.org/abs/2602.22674v1
- Date: Thu, 26 Feb 2026 06:45:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.560309
- Title: SPMamba-YOLO: An Underwater Object Detection Network Based on Multi-Scale Feature Enhancement and Global Context Modeling
- Title(参考訳): マルチスケール特徴強調とグローバルコンテキストモデリングに基づく水中物体検出ネットワークSPMamba-YOLO
- Authors: Guanghao Liao, Zhen Liu, Liyuan Cao, Yonghui Yang, Qi Li,
- Abstract要約: 本研究では,グローバルコンテキストモデリングとマルチスケール機能強化を統合した水中物体検出ネットワークを提案する。
URPC2022データセットの実験では、ネットワークがYOLOv8nベースラインを4.9%以上上回っていることが示されている。
- 参考スコア(独自算出の注目度): 12.390389688362506
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater object detection is a critical yet challenging research problem owing to severe light attenuation, color distortion, background clutter, and the small scale of underwater targets. To address these challenges, we propose SPMamba-YOLO, a novel underwater object detection network that integrates multi-scale feature enhancement with global context modeling. Specifically, a Spatial Pyramid Pooling Enhanced Layer Aggregation Network (SPPELAN) module is introduced to strengthen multi-scale feature aggregation and expand the receptive field, while a Pyramid Split Attention (PSA) mechanism enhances feature discrimination by emphasizing informative regions and suppressing background interference. In addition, a Mamba-based state space modeling module is incorporated to efficiently capture long-range dependencies and global contextual information, thereby improving detection robustness in complex underwater environments. Extensive experiments on the URPC2022 dataset demonstrate that SPMamba-YOLO outperforms the YOLOv8n baseline by more than 4.9\% in mAP@0.5, particularly for small and densely distributed underwater objects, while maintaining a favorable balance between detection accuracy and computational cost.
- Abstract(参考訳): 水中物体検出は、厳しい光の減衰、色歪み、背景のぼやけ、水中の標的の小さなスケールなど、重要な研究課題である。
これらの課題に対処するために,グローバルコンテキストモデリングとマルチスケール機能強化を統合した新しい水中物体検出ネットワークであるSPMamba-YOLOを提案する。
具体的には,SPPELAN(Spatial Pyramid Pooling Enhanced Layer Aggregation Network)モジュールを導入し,マルチスケールの特徴集約を強化し,受容領域を拡大する。
さらに、マンバをベースとした状態空間モデリングモジュールが組み込まれ、長距離の依存関係とグローバルな文脈情報を効率的に取得し、複雑な水中環境におけるロバスト性の検出を改善する。
URPC2022データセットの大規模な実験により、SPMamba-YOLOは、検出精度と計算コストのバランスを保ちながら、特に小型で高密度に分散した水中天体において、YOLOv8nベースラインを4.9 %以上上回っていることが示された。
関連論文リスト
- An AI-Powered Autonomous Underwater System for Sea Exploration and Scientific Research [0.0]
伝統的な海洋探査は、極端な条件、限られた視認性、高いコストのために重大な課題に直面している。
本稿では,これらの制約を克服するために,AIを活用した自律水中車両(AUV)システムを提案する。
このシステムは、リアルタイムオブジェクト検出のためのYOLOv12 Nano、特徴抽出のためのConvolutional Neural Network (CNN) (ResNet50)、海洋オブジェクトのグループ化のためのK-Means++クラスタリングを統合する。
論文 参考訳(メタデータ) (2025-12-08T15:45:40Z) - MGDFIS: Multi-scale Global-detail Feature Integration Strategy for Small Object Detection [12.838872442435527]
UAV画像の小さな物体検出は、探索・救助、交通監視、環境監視といった用途に不可欠である。
既存のマルチスケール融合法は、計算負荷を増し、詳細をぼかすのに役立つ。
本稿では,グローバルコンテキストと局所的な詳細を密結合して検出性能を向上させる統合融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-15T02:54:25Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - MSCA-Net:Multi-Scale Context Aggregation Network for Infrared Small Target Detection [0.1759252234439348]
本稿では,3つのキーコンポーネントを統合したMSCA-Netというネットワークアーキテクチャを提案する。
MSEDAは、異なるスケールにわたる情報を適応的に集約するために、マルチスケールのフュージョンアテンション機構を使用している。
PCBAMは相関行列に基づく戦略によりグローバル特徴と局所特徴の相関を捉える。
CABは、それらに重みを割り当て、低レベル情報と高レベル情報を統合することで、重要な特徴の表現を強化する。
論文 参考訳(メタデータ) (2025-03-21T14:42:31Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Dense Attention Fluid Network for Salient Object Detection in Optical
Remote Sensing Images [193.77450545067967]
光リモートセンシング画像(RSI)における有意物体検出のためのエンド・ツー・エンドDense Attention Fluid Network(DAFNet)を提案する。
GCA(Global Context-Aware Attention)モジュールは、長距離の意味的関係を適応的にキャプチャするために提案される。
我々は、2000枚の画像とピクセルワイドなサリエンシアノテーションを含むSODのための新しい、挑戦的な光学RSIデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-26T06:14:10Z) - Salient Object Detection Combining a Self-attention Module and a Feature
Pyramid Network [10.81245352773775]
本稿では,新しいピラミッド自己保持モジュール (PSAM) と独立機能補完戦略の採用を提案する。
PSAMでは、よりリッチな高レベルの特徴をキャプチャし、より大きな受容場をモデルにもたらすために、多スケールピラミッド機能の後、自己注意層が装備される。
論文 参考訳(メタデータ) (2020-04-30T03:08:34Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。