論文の概要: A Marine Debris Detection Framework for Ocean Robots via Self-Attention Enhancement and Feature Interaction Optimization
- arxiv url: http://arxiv.org/abs/2605.07388v1
- Date: Fri, 08 May 2026 07:43:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.89723
- Title: A Marine Debris Detection Framework for Ocean Robots via Self-Attention Enhancement and Feature Interaction Optimization
- Title(参考訳): 自己注意向上と特徴相互作用最適化による海洋ロボットの海難検知フレームワーク
- Authors: Yuyang Li, Jiashu Han, Yinyi Lai, Wenbin Kang, Zenghui Liu,
- Abstract要約: 海洋ロボットの海洋破片検出は生態学的保護に不可欠であるが、その性能は、ぼやけ、複雑な背景、小さなターゲットを持つ低品質の画像によって劣化することが多い。
拡張されたYOLOベースの検出フレームワークであるYOLO-MDを提案する。
Dual-Branch Convolutional Enhanced Self-Attention (DB-CASA)モジュールは、空間チャネル相互作用を強化し、劣化した画像の特徴表現を改善するように設計されている。
パラメータ効率を保ちながら、様々なスケールのオブジェクトに対するきめ細かい特徴抽出を強化するために、軽量なシフトベース演算を導入した。
- 参考スコア(独自算出の注目度): 3.9723394831068943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Marine debris detection for ocean robot is crucial for ecological protection, yet performance is often degraded by low-quality images with blur, complex backgrounds, and small targets. To address these challenges, we propose YOLO-MD, an enhanced YOLO-based detection framework. A Dual-Branch Convolutional Enhanced Self-Attention (DB-CASA) module is designed to strengthen spatial-channel interactions, improving feature representation in degraded images. Additionally, a lightweight shift-based operation is introduced to enhance fine-grained feature extraction for objects of varying scales while maintaining parameter efficiency. We further propose SFG-Loss to mitigate class imbalance and optimization instability via dynamic sample reweighting. Experiments on the UODM dataset demonstrate that YOLO-MD achieves 0.875 precision, 0.822 F1-score, and 0.849 mAP50, outperforming the latest state-of-the-art methods. The effectiveness of this method has also been verified through real-world robotic edge deployment experiments.
- Abstract(参考訳): 海洋ロボットの海洋破片検出は生態学的保護に不可欠であるが、その性能は、ぼやけ、複雑な背景、小さなターゲットを持つ低品質の画像によって劣化することが多い。
これらの課題に対処するために、拡張されたYOLOベースの検出フレームワークであるYOLO-MDを提案する。
Dual-Branch Convolutional Enhanced Self-Attention (DB-CASA)モジュールは、空間チャネル相互作用を強化し、劣化した画像の特徴表現を改善するように設計されている。
さらに、パラメータ効率を保ちながら、様々なスケールのオブジェクトに対するきめ細かい特徴抽出を強化するために、軽量なシフトベース演算を導入した。
さらに,クラス不均衡と動的サンプル再重み付けによる最適化の不安定性を軽減するため,SFG-Lossを提案する。
UODMデータセットの実験では、YOLO-MDは0.875の精度、0.822のF1スコア、0.849のmAP50を達成した。
この手法の有効性は、実世界のロボットエッジ展開実験を通じて検証されている。
関連論文リスト
- Adaptive Enhancement and Dual-Pooling Sequential Attention for Lightweight Underwater Object Detection with YOLOv10 [0.0]
この原稿では、YOLOv10アーキテクチャを基盤として、水中オブジェクト検出のための合理化されながら堅牢なフレームワークを紹介している。
提案手法は,画像品質向上のためのマルチステージ適応拡張モジュールと,マルチスケール特徴表現を強化するためのデュアルプールシーケンスアテンション機構を統合した。
論文 参考訳(メタデータ) (2026-03-04T07:39:57Z) - Denoising-Enhanced YOLO for Robust SAR Ship Detection [9.818917054838964]
CPN-YOLOは、YOLOv8上に構築された高精度な船舶検出フレームワークである。
本稿では,入力前処理のための学習可能な大規模カーネル記述モジュールを提案する。
第2に,マルチスケールモデリングの強化を目的としたアテンション機構に基づく特徴抽出強化戦略を設計する。
論文 参考訳(メタデータ) (2026-02-27T09:00:19Z) - YOLO-DS: Fine-Grained Feature Decoupling via Dual-Statistic Synergy Operator for Object Detection [55.58092342624062]
DSO(Dual-Statistic Synergy Operator)を中心に構築されたYOLO-DSを提案する。
YOLO-DSは、チャネル平均とピーク平均差を共同でモデル化することにより、オブジェクトの特徴を分離する。
MS-COCOベンチマークでは、YOLO-DSは5つのモデルスケールでYOLOv8を上回っている。
論文 参考訳(メタデータ) (2026-01-26T05:50:32Z) - HAD: Hierarchical Asymmetric Distillation to Bridge Spatio-Temporal Gaps in Event-Based Object Tracking [80.07224739976911]
イベントカメラは例外的な時間分解能と範囲(モード)を提供する
RGBカメラは高解像度でリッチテクスチャを捉えるのに優れていますが、イベントカメラは例外的な時間分解能とレンジ(モダル)を提供します。
論文 参考訳(メタデータ) (2025-10-22T13:15:13Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - YOLO-RS: Remote Sensing Enhanced Crop Detection Methods [0.32985979395737786]
既存のターゲット検出手法は、リモートセンシング画像において、小さなターゲットを扱う際の性能が劣っている。
YOLO-RSは、小さなターゲットの検出を大幅に強化した最新のYolov11に基づいている。
リモートセンシング画像における小目標検出作業におけるYOLO-RSの有効性と適用可能性を検証する実験を行った。
論文 参考訳(メタデータ) (2025-04-15T13:13:22Z) - LAM-YOLO: Drones-based Small Object Detection on Lighting-Occlusion Attention Mechanism YOLO [0.9062164411594178]
LAM-YOLOは、ドローンベースの画像に特化して設計されたオブジェクト検出モデルである。
我々は、異なる照明条件下での小さな目標の視認性を高めるために、光遮断注意機構を導入する。
次に、回帰損失関数として改良されたSIB-IoUを用いてモデル収束を加速し、局所化精度を向上させる。
論文 参考訳(メタデータ) (2024-11-01T10:00:48Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。