論文の概要: Improve Underwater Object Detection through YOLOv12 Architecture and Physics-informed Augmentation
- arxiv url: http://arxiv.org/abs/2506.23505v1
- Date: Mon, 30 Jun 2025 04:06:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.915488
- Title: Improve Underwater Object Detection through YOLOv12 Architecture and Physics-informed Augmentation
- Title(参考訳): YOLOv12アーキテクチャによる水中物体検出と物理インフォーマル化
- Authors: Tinh Nguyen,
- Abstract要約: 水中物体検出は、自律航法、環境モニタリング、海洋探査に不可欠である。
現在の手法は精度と計算効率のバランスをとるが、低視認性条件下でのリアルタイムのデプロイには困難がある。
本研究は, YOLOv12アーキテクチャと物理インフォームド・オービメンテーション技術の統合による水中検出を推し進めるものである。
- 参考スコア(独自算出の注目度): 0.20767168898581637
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater object detection is crucial for autonomous navigation, environmental monitoring, and marine exploration, but it is severely hampered by light attenuation, turbidity, and occlusion. Current methods balance accuracy and computational efficiency, but they have trouble deploying in real-time under low visibility conditions. Through the integration of physics-informed augmentation techniques with the YOLOv12 architecture, this study advances underwater detection. With Residual ELAN blocks to preserve structural features in turbid waters and Area Attention to maintain large receptive fields for occluded objects while reducing computational complexity. Underwater optical properties are addressed by domain-specific augmentations such as turbulence adaptive blurring, biologically grounded occlusion simulation, and spectral HSV transformations for color distortion. Extensive tests on four difficult datasets show state-of-the-art performance, with Brackish data registering 98.30% mAP at 142 FPS. YOLOv12 improves occlusion robustness by 18.9%, small-object recall by 22.4%, and detection precision by up to 7.94% compared to previous models. The crucial role of augmentation strategy is validated by ablation studies. This work offers a precise and effective solution for conservation and underwater robotics applications.
- Abstract(参考訳): 水中物体検出は、自律航法、環境モニタリング、海洋探査において重要であるが、光の減衰、濁度、閉塞によって著しく妨げられている。
現在の手法は精度と計算効率のバランスをとるが、低視認性条件下でのリアルタイムのデプロイには困難がある。
物理インフォームド・オービメンテーション技術とYOLOv12アーキテクチャの統合により, 水中検出の高度化が図られた。
残留ELANブロックは、濁水の構造的特徴を保ち、エリアアテンションは、計算複雑性を低減しつつ、閉塞物に対する大きな受容場を維持する。
水中の光学特性は、乱流適応的ぼかし、生物学的に接地した閉塞シミュレーション、色歪みに対するスペクトルHSV変換などの領域固有の拡張によって対処される。
4つの難しいデータセットの大規模なテストは、最先端のパフォーマンスを示し、Brackishのデータは142 FPSで98.30%のmAPを登録している。
YOLOv12は18.9%、小物体リコール22.4%、検出精度7.94%の改善を行った。
増強戦略の重要な役割はアブレーション研究によって検証される。
この研究は、保全と水中ロボット工学の応用のための正確で効果的なソリューションを提供する。
関連論文リスト
- Learning Underwater Active Perception in Simulation [51.205673783866146]
タービディティは、検査された構造物の正確な視覚的記録を阻止する可能性があるため、ミッション全体を危険に晒す可能性がある。
従来の研究は、濁度や後方散乱に適応する手法を導入してきた。
本研究では, 広範囲の水環境下での高品質な画像取得を実現するための, 単純かつ効率的なアプローチを提案する。
論文 参考訳(メタデータ) (2025-04-23T06:48:38Z) - You Sense Only Once Beneath: Ultra-Light Real-Time Underwater Object Detection [2.5249064981269296]
超軽量リアルタイム水中物体検出フレームワークYSOOB(You Sense Only Beneath)を提案する。
具体的には、マルチスペクトルウェーブレット(MSWE)を用いて入力画像の周波数領域符号化を行い、水中光色歪みによる意味損失を最小限に抑える。
また、単純で効果的なチャネル圧縮によりモデル冗長性を排除し、モデル軽量化のために大カーネル畳み込み(RLKC)を再構築する。
論文 参考訳(メタデータ) (2025-04-22T08:26:35Z) - Improving Underwater Visual Tracking With a Large Scale Dataset and
Image Enhancement [70.2429155741593]
本稿では,水中ビジュアルオブジェクト追跡(UVOT)のための新しいデータセットと汎用トラッカ拡張手法を提案する。
水中環境は、一様でない照明条件、視界の低さ、鋭さの欠如、コントラストの低さ、カモフラージュ、懸濁粒子からの反射を示す。
本研究では,追尾品質の向上に特化して設計された水中画像強調アルゴリズムを提案する。
この手法により、最先端(SOTA)ビジュアルトラッカーの最大5.0%のAUCの性能が向上した。
論文 参考訳(メタデータ) (2023-08-30T07:41:26Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - Efficient Real-time Smoke Filtration with 3D LiDAR for Search and Rescue
with Autonomous Heterogeneous Robotic Systems [56.838297900091426]
スモークとダストは、搭載された知覚システムに依存するため、あらゆる移動ロボットプラットフォームの性能に影響を与える。
本稿では,重みと空間情報に基づく新しいモジュラー計算フィルタを提案する。
論文 参考訳(メタデータ) (2023-08-14T16:48:57Z) - DeepSeaNet: Improving Underwater Object Detection using EfficientDet [0.0]
このプロジェクトでは、注釈付き水中データセット上で様々な物体検出モデルを実装し、評価する。
このデータセットは、Limfjorden水中で捕獲された魚、カニ、ヒトデ、その他の水生動物の注釈画像からなる。
I compare the results of YOLOv3 (31.10% mean Average Precision (mAP)), YOLOv4 (83.72% mAP), YOLOv5 (97.6%), YOLOv8 (98.20%), EfficientDet (98.56% mAP) and Detectron2 (95.20% mAP) on the same dataset。
論文 参考訳(メタデータ) (2023-05-26T13:41:35Z) - DeepAqua: Self-Supervised Semantic Segmentation of Wetland Surface Water
Extent with SAR Images using Knowledge Distillation [44.99833362998488]
トレーニングフェーズ中に手動アノテーションを不要にする自己教師型ディープラーニングモデルであるDeepAquaを提案する。
我々は、光とレーダーをベースとしたウォーターマスクが一致する場合を利用して、水面と植物の両方を検知する。
実験の結果,DeepAquaの精度は7%向上し,Intersection Over Unionが27%,F1が14%向上した。
論文 参考訳(メタデータ) (2023-05-02T18:06:21Z) - GAMMA: Generative Augmentation for Attentive Marine Debris Detection [0.0]
そこで本稿では,水中デブリデータによる視覚的検出の不適切な問題を解決するために,効率的で生成的な拡張手法を提案する。
我々は、CycleGANをデータ拡張技術として使用し、地球上のプラスチックのオープンで豊富なデータを水中画像に変換する。
また,アテンション機構を用いた水中デブリ検出のための新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-12-07T16:30:51Z) - Learning-based estimation of in-situ wind speed from underwater
acoustics [58.293528982012255]
水中音響から風速時系列を検索するための深層学習手法を提案する。
我々のアプローチは、事前の物理知識と計算効率の両面から恩恵を受けるために、データ同化と学習ベースのフレームワークをブリッジする。
論文 参考訳(メタデータ) (2022-08-18T15:27:40Z) - A Novel Underwater Image Enhancement and Improved Underwater Biological
Detection Pipeline [8.326477369707122]
本稿では, YOLOv5 バックボーンに畳み込みブロックアテンションモジュール (CBAM) を付加した特徴情報を取得する手法を提案する。
物体特性に対する水中生物特性の干渉が減少し、対象情報に対するバックボーンネットワークの出力が向上する。
論文 参考訳(メタデータ) (2022-05-20T14:18:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。