論文の概要: Enhancing Underwater Object Detection through Spatio-Temporal Analysis and Spatial Attention Networks
- arxiv url: http://arxiv.org/abs/2510.25797v1
- Date: Wed, 29 Oct 2025 01:22:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.491917
- Title: Enhancing Underwater Object Detection through Spatio-Temporal Analysis and Spatial Attention Networks
- Title(参考訳): 時空間解析と空間アテンションネットワークによる水中物体検出の強化
- Authors: Sai Likhith Karri, Ansh Saxena,
- Abstract要約: 時間増強型YOLOv5変異T-YOLOv5を標準のYOLOv5と比較して評価した。
第2フェーズでは、CBAM(Conal Block Attention Module)の追加により、T-YOLOv5の拡張バージョンが開発されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study examines the effectiveness of spatio-temporal modeling and the integration of spatial attention mechanisms in deep learning models for underwater object detection. Specifically, in the first phase, the performance of temporal-enhanced YOLOv5 variant T-YOLOv5 is evaluated, in comparison with the standard YOLOv5. For the second phase, an augmented version of T-YOLOv5 is developed, through the addition of a Convolutional Block Attention Module (CBAM). By examining the effectiveness of the already pre-existing YOLOv5 and T-YOLOv5 models and of the newly developed T-YOLOv5 with CBAM. With CBAM, the research highlights how temporal modeling improves detection accuracy in dynamic marine environments, particularly under conditions of sudden movements, partial occlusions, and gradual motion. The testing results showed that YOLOv5 achieved a mAP@50-95 of 0.563, while T-YOLOv5 and T-YOLOv5 with CBAM outperformed with mAP@50-95 scores of 0.813 and 0.811, respectively, highlighting their superior accuracy and generalization in detecting complex objects. The findings demonstrate that T-YOLOv5 significantly enhances detection reliability compared to the standard model, while T-YOLOv5 with CBAM further improves performance in challenging scenarios, although there is a loss of accuracy when it comes to simpler scenarios.
- Abstract(参考訳): 本研究では,水中物体検出のための深層学習モデルにおける時空間モデルの有効性と空間的注意機構の統合について検討した。
具体的には、第1段階では、標準のYOLOv5と比較して、時間増強型YOLOv5変種T-YOLOv5の性能を評価する。
第2フェーズでは、CBAM(Convolutional Block Attention Module)の追加により、T-YOLOv5の拡張バージョンが開発された。
既存のYOLOv5およびT-YOLOv5モデルとCBAMを用いたT-YOLOv5の有効性を検証した。
CBAMでは、特に急激な動き、部分閉塞、段階的な動きの条件下で、時間的モデリングが動的海洋環境における検出精度をいかに改善するかを強調している。
実験の結果, YOLOv5は0.563mAP@50-95, T-YOLOv5は0.813mAP@50-95, T-YOLOv5は0.811mAP@50-95, T-YOLOv5は0。
その結果,T-YOLOv5は標準モデルと比較して検出信頼性を著しく向上する一方,CBAMを用いたT-YOLOv5はより単純なシナリオでは精度が低下するにもかかわらず,難解なシナリオでは性能が向上することがわかった。
関連論文リスト
- Ensemble YOLO Framework for Multi-Domain Mitotic Figure Detection in Histopathology Images [0.7541656202645494]
YOLOv5とYOLOv8の2つの近代的な1段検出器は、MIDOG++、CMC、CCMCTデータセットで訓練された。
YOLOv5は高い精度(84.3%)を達成し、YOLOv8は改善されたリコール(82.6%)を提供した。
我々のアンサンブルは、F1スコア79.2%、精度73.6%、リコール85.8%で5位にランクされ、提案された戦略が未確認のテストデータに対して効果的に一般化されていることを確認した。
論文 参考訳(メタデータ) (2025-09-03T02:43:02Z) - YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception [58.06752127687312]
高精度で軽量な物体検出器YOLOv13を提案する。
ハイパーグラフに基づく適応相関強化(HyperACE)機構を提案する。
また,FullPAD(Full-Pipeline Aggregation-and-Distribution)パラダイムを提案する。
論文 参考訳(メタデータ) (2025-06-21T15:15:03Z) - YOLO-LLTS: Real-Time Low-Light Traffic Sign Detection via Prior-Guided Enhancement and Multi-Branch Feature Interaction [45.79993863157494]
YOLO-LLTSは、低照度環境向けに設計されたエンドツーエンドのリアルタイム信号検出アルゴリズムである。
YOLO-LLTSは、HRFM-SOD(High-Resolution Feature Map for Small Object Detection)、MFIA(Multi-branch Feature Interaction Attention)、PGFE(Presideed-Guided Feature Enhancement Module)の3つの主要なコントリビューションを紹介している。
実験の結果、YOLO-LLTSは最新技術の性能を達成し、TT100K-nightでは2.7% mAP50:95と1.6% mAP50:95よりも優れていた。
論文 参考訳(メタデータ) (2025-03-18T04:28:05Z) - YOLOv5, YOLOv8 and YOLOv10: The Go-To Detectors for Real-time Vision [0.6662800021628277]
本稿では、YOLOv5, YOLOv8, YOLOv10に着目し、YOLO(You Only Look Once)オブジェクト検出アルゴリズムの進化に焦点を当てた。
これらのバージョンにまたがるエッジデプロイメントのアーキテクチャの進歩、パフォーマンスの改善、適合性を分析します。
論文 参考訳(メタデータ) (2024-07-03T10:40:20Z) - YOLOv10: Real-Time End-to-End Object Detection [68.28699631793967]
リアルタイムオブジェクト検出の分野では,YOLOが主流のパラダイムとして浮上している。
非最大抑圧(NMS)による処理後ハマーによるYOLOのエンドツーエンドデプロイメントへの依存。
YOLOの総合的効率-精度駆動型モデル設計戦略を紹介する。
論文 参考訳(メタデータ) (2024-05-23T11:44:29Z) - YOLOv5 vs. YOLOv8 in Marine Fisheries: Balancing Class Detection and Instance Count [0.0]
本稿では, YOLOv5 と YOLOv8 を用いて, 動脈, 嚢胞, 排便の3つの異なるクラスについて, 対象物検出法の比較検討を行った。
YOLOv5は、高い精度と精度で、動脈と嚢胞を検出できる。
しかし、排他物を検出するということになると、YOLOv5は顕著な課題と限界に直面した。
論文 参考訳(メタデータ) (2024-04-01T20:01:04Z) - YOLOv8-AM: YOLOv8 Based on Effective Attention Mechanisms for Pediatric Wrist Fracture Detection [0.0]
本研究は,本来のYOLOv8アーキテクチャにアテンション機構を組み込んだYOLOv8-AMを提案する。
ResBlock + CBAM (ResCBAM) に基づくYOLOv8-AMモデルのIoU 50(mAP 50)の平均精度は63.6%から65.8%に向上し,SOTAの性能が向上した。
論文 参考訳(メタデータ) (2024-02-14T17:18:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。