論文の概要: An Empirical Study on the Robustness of YOLO Models for Underwater Object Detection
- arxiv url: http://arxiv.org/abs/2509.17561v1
- Date: Mon, 22 Sep 2025 10:55:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.319856
- Title: An Empirical Study on the Robustness of YOLO Models for Underwater Object Detection
- Title(参考訳): 水中物体検出のためのYOLOモデルのロバスト性に関する実証的研究
- Authors: Edwine Nabahirwa, Wei Song, Minghua Zhang, Shufan Chen,
- Abstract要約: 6つの模擬水中環境における最近のYOLO変異体(YOLOv8-YOLOv12)の総合評価を行った。
以上の結果から,YOLOv12は全体的な性能が最も高いが,騒音に強いことが示唆された。
実験の結果、画像数とインスタンス頻度は、主に検出性能を駆動し、物体の外観は二次的な影響しか与えないことがわかった。
- 参考スコア(独自算出の注目度): 5.084022830578536
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Underwater object detection (UOD) remains a critical challenge in computer vision due to underwater distortions which degrade low-level features and compromise the reliability of even state-of-the-art detectors. While YOLO models have become the backbone of real-time object detection, little work has systematically examined their robustness under these uniquely challenging conditions. This raises a critical question: Are YOLO models genuinely robust when operating under the chaotic and unpredictable conditions of underwater environments? In this study, we present one of the first comprehensive evaluations of recent YOLO variants (YOLOv8-YOLOv12) across six simulated underwater environments. Using a unified dataset of 10,000 annotated images from DUO and Roboflow100, we not only benchmark model robustness but also analyze how distortions affect key low-level features such as texture, edges, and color. Our findings show that (1) YOLOv12 delivers the strongest overall performance but is highly vulnerable to noise, and (2) noise disrupts edge and texture features, explaining the poor detection performance in noisy images. Class imbalance is a persistent challenge in UOD. Experiments revealed that (3) image counts and instance frequency primarily drive detection performance, while object appearance exerts only a secondary influence. Finally, we evaluated lightweight training-aware strategies: noise-aware sample injection, which improves robustness in both noisy and real-world conditions, and fine-tuning with advanced enhancement, which boosts accuracy in enhanced domains but slightly lowers performance in original data, demonstrating strong potential for domain adaptation, respectively. Together, these insights provide practical guidance for building resilient and cost-efficient UOD systems.
- Abstract(参考訳): 水中物体検出(UOD)は、低レベルの特徴を低下させ、最先端の検出器の信頼性を損なう水中歪みのため、コンピュータビジョンにおいて依然として重要な課題である。
YOLOモデルはリアルタイム物体検出のバックボーンとなっているが、これらの特異な条件下での頑健さを体系的に検討する研究はほとんどない。
YOLOモデルは、カオス的で予測不可能な水中環境下での動作において、真に堅牢か?
本研究では,6つの模擬水中環境における最近のYOLO変異体(YOLOv8-YOLOv12)の総合評価を行った。
DUOとRoboflow100からの1万の注釈付き画像の統合データセットを使用して、モデルの堅牢性をベンチマークするだけでなく、テクスチャ、エッジ、色といった重要な低レベルの特徴に歪みがどのように影響するかを分析する。
以上の結果から,(1)YOLOv12は耐雑音性が高く,(2)ノイズがエッジやテクスチャの特徴を損なうことが示唆され,ノイズ検出性能の低下が示唆された。
クラス不均衡はUODにおける永続的な課題である。
実験の結果、(3)画像数と事例周波数が主に検出性能を駆動し、一方、物体の外観は二次的な影響しか与えないことがわかった。
最後に、ノイズ認識型サンプルインジェクション(ノイズ認識型サンプルインジェクション)の評価を行い、ノイズ認識型サンプルインジェクション(ノイズ認識型サンプルインジェクション)を用いて、ノイズ認識と実世界の両方の条件での堅牢性を向上し、高度な拡張による微調整により、拡張されたドメインの精度は向上するが、元のデータの性能はわずかに低下し、ドメイン適応の強い可能性を示す。
これらの知見が組み合わさって、弾力性とコスト効率の良いUDDシステムを構築するための実践的なガイダンスを提供する。
関連論文リスト
- Underwater Waste Detection Using Deep Learning A Performance Comparison of YOLOv7 to 10 and Faster RCNN [0.0]
YOLOv7, YOLOv8, YOLOv9, および高速領域畳み込みニューラルネットワーク(R-CNN)を含む5つの最先端物体認識アルゴリズムの性能について検討した。
YOLOv8は、平均平均精度(mAP)が80.9%で他より優れており、大きなパフォーマンスを示している。
これらの結果から, YOLOv8モデルが大気汚染対策に有効である可能性が示唆された。
論文 参考訳(メタデータ) (2025-07-25T05:36:37Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [78.18946529195254]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - YOLO-Based Pipeline Monitoring in Challenging Visual Environments [0.0]
低視認性水中環境における海底パイプラインの状況監視は、濁度、光歪み、画像劣化などによる大きな課題を生んでいる。
従来の視覚ベースの検査システムは、そのような状況下でのマッピング、オブジェクト認識、欠陥検出のための信頼性の高いデータの提供に失敗することが多い。
本研究では、画像品質の向上、パイプライン構造の検出、自律的故障診断支援のための高度な人工知能(AI)技術の統合について検討する。
論文 参考訳(メタデータ) (2025-06-30T14:47:30Z) - Sonar-based Deep Learning in Underwater Robotics: Overview, Robustness and Challenges [0.46873264197900916]
水中でのソナーの使用は、限られた訓練データと固有のノイズが特徴であり、頑丈さをモデル化する上での課題となっている。
本稿では,分類,物体検出,セグメンテーション,SLAMなどのソナーベース認知タスクモデルについて検討する。
ソナーベースの最先端データセット、シミュレータ、ニューラルネットワーク検証、アウト・オブ・ディストリビューション、敵攻撃などの堅牢性メソッドを体系化する。
論文 参考訳(メタデータ) (2024-12-16T15:03:08Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Exploring the Physical World Adversarial Robustness of Vehicle Detection [13.588120545886229]
アドリアックは現実世界の検知モデルの堅牢性を損なう可能性がある。
CARLAシミュレータを用いた革新的なインスタントレベルデータ生成パイプラインを提案する。
本研究は, 逆境条件下での多種多様なモデル性能について考察した。
論文 参考訳(メタデータ) (2023-08-07T11:09:12Z) - OOD-CV-v2: An extended Benchmark for Robustness to Out-of-Distribution
Shifts of Individual Nuisances in Natural Images [59.51657161097337]
OOD-CV-v2は、ポーズ、形状、テクスチャ、コンテキスト、気象条件の10のオブジェクトカテゴリのアウト・オブ・ディストリビューションの例を含むベンチマークデータセットである。
この新たなデータセットに加えて、一般的なベースライン手法を用いた広範な実験にも貢献する。
論文 参考訳(メタデータ) (2023-04-17T20:39:25Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Underwater Object Classification and Detection: first results and open
challenges [1.1549572298362782]
本研究は,水中環境における物体検出の問題点を概観する。
我々は、従来の最先端(SOTA)アルゴリズムの欠点を分析し、定量化する。
論文 参考訳(メタデータ) (2022-01-04T04:54:08Z) - Assessing out-of-domain generalization for robust building damage
detection [78.6363825307044]
建築損傷検出は、衛星画像にコンピュータビジョン技術を適用することで自動化することができる。
モデルは、トレーニングで利用可能な災害画像と、新しいイベントの画像の間の分散の変化に対して堅牢でなければならない。
今後はOOD体制に重点を置くべきだと我々は主張する。
論文 参考訳(メタデータ) (2020-11-20T10:30:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。