論文の概要: Adaptive Enhancement and Dual-Pooling Sequential Attention for Lightweight Underwater Object Detection with YOLOv10
- arxiv url: http://arxiv.org/abs/2603.03807v1
- Date: Wed, 04 Mar 2026 07:39:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.223328
- Title: Adaptive Enhancement and Dual-Pooling Sequential Attention for Lightweight Underwater Object Detection with YOLOv10
- Title(参考訳): YOLOv10による軽量水中物体検出のための適応的強化とデュアルプールシーケンスアテンション
- Authors: Md. Mushibur Rahman, Umme Fawzia Rahim, Enam Ahmed Taufik,
- Abstract要約: この原稿では、YOLOv10アーキテクチャを基盤として、水中オブジェクト検出のための合理化されながら堅牢なフレームワークを紹介している。
提案手法は,画像品質向上のためのマルチステージ適応拡張モジュールと,マルチスケール特徴表現を強化するためのデュアルプールシーケンスアテンション機構を統合した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Underwater object detection constitutes a pivotal endeavor within the realms of marine surveillance and autonomous underwater systems; however, it presents significant challenges due to pronounced visual impairments arising from phenomena such as light absorption, scattering, and diminished contrast. In response to these formidable challenges, this manuscript introduces a streamlined yet robust framework for underwater object detection, grounded in the YOLOv10 architecture. The proposed method integrates a Multi-Stage Adaptive Enhancement module to improve image quality, a Dual-Pooling Sequential Attention (DPSA) mechanism embedded into the backbone to strengthen multi-scale feature representation, and a Focal Generalized IoU Objectness (FGIoU) loss to jointly improve localization accuracy and objectness prediction under class imbalance. Comprehensive experimental evaluations conducted on the RUOD and DUO benchmark datasets substantiate that the proposed DPSA_FGIoU_YOLOv10n attains exceptional performance, achieving mean Average Precision (mAP) scores of 88.9% and 88.0% at IoU threshold 0.5, respectively. In comparison to the baseline YOLOv10n, this represents enhancements of 6.7% for RUOD and 6.2% for DUO, all while preserving a compact model architecture comprising merely 2.8M parameters. These findings validate that the proposed framework establishes an efficacious equilibrium among accuracy, robustness, and real-time operational efficiency, making it suitable for deployment in resource-constrained underwater settings.
- Abstract(参考訳): 水中物体検出は、海洋監視と自律型水中システムの領域における重要な取り組みとなっているが、光吸収、散乱、コントラストの減少といった現象によって引き起こされる視覚的障害が顕著な課題である。
これらの厳しい課題に応えて、この原稿はYOLOv10アーキテクチャを基盤として、水中オブジェクト検出のための合理化されながら堅牢なフレームワークを導入している。
提案手法は,画像品質向上のためのマルチステージ適応拡張モジュールと,マルチスケール特徴表現を強化するためにバックボーンに組み込まれたデュアルプールシーケンスアテンション(DPSA)機構と,クラス不均衡下での局所化精度とオブジェクトネス予測を両立させるFocal Generalized IoU Objectness(FGIoU)損失を統合する。
提案したDPSA_FGIoU_YOLOv10nは,平均精度(mAP)スコアが88.9%,平均精度(mAP)スコアが88.0%であることを示す。
ベースラインのYOLOv10nと比較して、RUODの6.7%、DUOの6.2%が拡張され、わずか2.8Mのパラメータからなるコンパクトなモデルアーキテクチャが保たれている。
これらの結果から,提案手法は精度,堅牢性,実運用効率の両立を図り,資源に制約のある水中環境への展開に適していることがわかった。
関連論文リスト
- Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage [65.51149575007149]
本稿では,Fun-DDPSについて述べる。Fun-DDPSは,関数空間拡散モデルと微分可能なニューラル演算子サロゲートを結合した生成フレームワークである。
Fun-DDPSは、ジョイントステートベースラインで観察される高周波アーティファクトから、物理的に一貫した実現をもたらす。
論文 参考訳(メタデータ) (2026-02-12T18:58:12Z) - YOLO-DS: Fine-Grained Feature Decoupling via Dual-Statistic Synergy Operator for Object Detection [55.58092342624062]
DSO(Dual-Statistic Synergy Operator)を中心に構築されたYOLO-DSを提案する。
YOLO-DSは、チャネル平均とピーク平均差を共同でモデル化することにより、オブジェクトの特徴を分離する。
MS-COCOベンチマークでは、YOLO-DSは5つのモデルスケールでYOLOv8を上回っている。
論文 参考訳(メタデータ) (2026-01-26T05:50:32Z) - HAD: Hierarchical Asymmetric Distillation to Bridge Spatio-Temporal Gaps in Event-Based Object Tracking [80.07224739976911]
イベントカメラは例外的な時間分解能と範囲(モード)を提供する
RGBカメラは高解像度でリッチテクスチャを捉えるのに優れていますが、イベントカメラは例外的な時間分解能とレンジ(モダル)を提供します。
論文 参考訳(メタデータ) (2025-10-22T13:15:13Z) - DoRAN: Stabilizing Weight-Decomposed Low-Rank Adaptation via Noise Injection and Auxiliary Networks [47.58150560549918]
重み分解低ランク適応(DoRA)は,バニラ低ランク適応(LoRA)法の学習能力と訓練安定性の両方を改善することが示されている。
そこで本研究では,DoRAのトレーニングを安定化し,サンプル効率を向上させるため,新しいDoRAの派生型であるDoRANを提案する。
論文 参考訳(メタデータ) (2025-10-05T19:27:48Z) - An Empirical Study on the Robustness of YOLO Models for Underwater Object Detection [5.084022830578536]
6つの模擬水中環境における最近のYOLO変異体(YOLOv8-YOLOv12)の総合評価を行った。
以上の結果から,YOLOv12は全体的な性能が最も高いが,騒音に強いことが示唆された。
実験の結果、画像数とインスタンス頻度は、主に検出性能を駆動し、物体の外観は二次的な影響しか与えないことがわかった。
論文 参考訳(メタデータ) (2025-09-22T10:55:21Z) - AquaFeat: A Features-Based Image Enhancement Model for Underwater Object Detection [0.0]
本稿では,タスク駆動機能拡張を行う新しいプラグイン・アンド・プレイモジュールであるAquaFeatを提案する。
提案手法は,マルチスケール機能強化ネットワークを訓練したエンドツーエンドと検出器の損失関数を統合する。
挑戦的な水中データセット上でYOLOv8mと統合されたAquaFeatは、最先端の精度(0.877)とリコール(0.624)を達成し、競争力のあるmAPスコア(0.677のmAP@0.5、mAP@[0.5:0.95]の0.421)を達成している。
論文 参考訳(メタデータ) (2025-08-17T12:22:18Z) - Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - Improve Underwater Object Detection through YOLOv12 Architecture and Physics-informed Augmentation [0.20767168898581637]
水中物体検出は、自律航法、環境モニタリング、海洋探査に不可欠である。
現在の手法は精度と計算効率のバランスをとるが、低視認性条件下でのリアルタイムのデプロイには困難がある。
本研究は, YOLOv12アーキテクチャと物理インフォームド・オービメンテーション技術の統合による水中検出を推し進めるものである。
論文 参考訳(メタデータ) (2025-06-30T04:06:50Z) - EPBC-YOLOv8: An efficient and accurate improved YOLOv8 underwater detector based on an attention mechanism [4.081096260595706]
YOLOv8の背骨にチャネルと空間的注意を組み込むことにより,水中目標検出の精度を高めた。
我々のフレームワークは水中画像の劣化に対処し、データセットで0.5のスコアが76.7%、79.0のmAPを達成した。
これらのスコアは元のYOLOv8よりも2.3%高く、0.7%高い。
論文 参考訳(メタデータ) (2025-02-09T06:09:56Z) - Source-Free Domain Adaptive Object Detection with Semantics Compensation [54.00183496587841]
Weak-to-strong Semantics Compensation (WSCo)を導入する。
WSCoは、クラス関連セマンティクスを補う。
WSCoは一般的なプラグインとして実装することができ、既存のSFODパイプラインと容易に統合できます。
論文 参考訳(メタデータ) (2024-10-07T23:32:06Z) - A Computer Vision Enabled damage detection model with improved YOLOv5
based on Transformer Prediction Head [0.0]
現在の最先端ディープラーニング(DL)に基づく損傷検出モデルは、複雑でノイズの多い環境では優れた特徴抽出能力を欠いていることが多い。
DenseSPH-YOLOv5は、DenseNetブロックをバックボーンに統合したリアルタイムDLベースの高性能損傷検出モデルである。
DenseSPH-YOLOv5は平均平均精度(mAP)が85.25%、F1スコアが81.18%、精度(P)が89.51%である。
論文 参考訳(メタデータ) (2023-03-07T22:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。