論文の概要: HMPNet: A Feature Aggregation Architecture for Maritime Object Detection from a Shipborne Perspective
- arxiv url: http://arxiv.org/abs/2505.08231v1
- Date: Tue, 13 May 2025 05:17:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.427334
- Title: HMPNet: A Feature Aggregation Architecture for Maritime Object Detection from a Shipborne Perspective
- Title(参考訳): HMPNet: 船舶からの海上物体検出のための特徴集約アーキテクチャ
- Authors: Yu Zhang, Fengyuan Liu, Juan Lyu, Yi Wei, Changdong Yu,
- Abstract要約: 様々な海洋環境と気象条件下での12の対象カテゴリに注釈付けされた新しいデータセットを提示する。
船舶搭載物体検出に適した軽量アーキテクチャであるHMPNetを提案する。
経験的評価は、HMPNetが現在の最先端の手法を精度と計算効率の両面で上回っていることを示している。
- 参考スコア(独自算出の注目度): 16.421691711725916
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the realm of intelligent maritime navigation, object detection from a shipborne perspective is paramount. Despite the criticality, the paucity of maritime-specific data impedes the deployment of sophisticated visual perception techniques, akin to those utilized in autonomous vehicular systems, within the maritime context. To bridge this gap, we introduce Navigation12, a novel dataset annotated for 12 object categories under diverse maritime environments and weather conditions. Based upon this dataset, we propose HMPNet, a lightweight architecture tailored for shipborne object detection. HMPNet incorporates a hierarchical dynamic modulation backbone to bolster feature aggregation and expression, complemented by a matrix cascading poly-scale neck and a polymerization weight sharing detector, facilitating efficient multi-scale feature aggregation. Empirical evaluations indicate that HMPNet surpasses current state-of-the-art methods in terms of both accuracy and computational efficiency, realizing a 3.3% improvement in mean Average Precision over YOLOv11n, the prevailing model, and reducing parameters by 23%.
- Abstract(参考訳): インテリジェント海洋航法の分野では、船上から物体を検出することが最重要である。
批判にも拘わらず、海洋固有のデータの質は、海洋環境の中で自律車体システムで使用されるものと同様に、洗練された視覚知覚技術の展開を妨げる。
このギャップを埋めるために、様々な海洋環境と気象条件下で12のオブジェクトカテゴリに注釈を付けた新しいデータセットであるNavigation12を紹介する。
本データセットに基づいて,船舶搭載物体検出に適した軽量アーキテクチャであるHMPNetを提案する。
HMPNetは、階層的な動的変調バックボーンを組み込んで特徴凝集と発現を促進させ、マトリックスカスケード多スケールネックと重合重量共有検出器で補完し、効率的な多スケール特徴凝集を容易にする。
実験的な評価では、HMPNetは精度と計算効率の両面で現在の最先端の手法を超越し、平均精度が平均3.3%向上し、標準モデルであるYOLOv11nよりも良くなり、パラメータが23%削減された。
関連論文リスト
- Efficient Oriented Object Detection with Enhanced Small Object Recognition in Aerial Images [2.9138705529771123]
本稿では,オブジェクト指向物体検出タスクに適したYOLOv8モデルを新たに拡張する。
本モデルでは,ASFP(Adaptive Scale Feature Pyramid)モジュールと,P2層の詳細を利用したウェーブレット変換に基づくC2fモジュールを特徴とする。
我々のアプローチは233万のパラメータを持つDecoupleNetよりも効率的なアーキテクチャ設計を提供し、検出精度を維持しています。
論文 参考訳(メタデータ) (2024-12-17T05:45:48Z) - MID: A Comprehensive Shore-Based Dataset for Multi-Scale Dense Ship Occlusion and Interaction Scenarios [10.748210940033484]
海上航行行動データセット(MID)は、複雑な海上環境における船舶検出の課題に対処するために設計されている。
MIDには5,673の画像と135,884の微調整されたターゲットインスタンスが含まれており、教師付き学習と半教師付き学習の両方をサポートしている。
MIDの画像は、43の水域を横断する現実世界のナビゲーションの高精細なビデオクリップから得られたもので、天候や照明条件も様々である。
論文 参考訳(メタデータ) (2024-12-08T09:34:23Z) - Divide-and-Conquer: Confluent Triple-Flow Network for RGB-T Salient Object Detection [70.84835546732738]
RGB-Thermal Salient Object Detectionは、目視と熱赤外画像のペア内の目立つ物体をピンポイントすることを目的としている。
従来のエンコーダ・デコーダアーキテクチャは、欠陥モードから生じるノイズに対する頑健さを十分に考慮していなかったかもしれない。
本稿では,Divide-and-Conquer戦略を用いた,堅牢なConfluent Triple-Flow NetworkであるConTriNetを提案する。
論文 参考訳(メタデータ) (2024-12-02T14:44:39Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - High-order Spatial Interactions Enhanced Lightweight Model for Optical
Remote Sensing Image-based Small Ship Detection [18.60170221864557]
我々は,高次空間相互作用に基づくtextitHSI-ShipDetectionNet という,新しい軽量フレームワークを提案する。
HSI-ShipDetectionNetには、小型船専用の予測ブランチと、複雑さの低減を目的とした軽量なハイブリッドアテンションブロックが含まれている。
本モデルでは,パブリックなKaggle海洋船舶検出データセットを用いて評価を行い,複数の最先端モデルと比較した。
論文 参考訳(メタデータ) (2023-04-07T18:40:49Z) - Adaptive Multi-source Predictor for Zero-shot Video Object Segmentation [68.56443382421878]
ゼロショットビデオオブジェクトセグメンテーション(ZVOS)のための新しい適応型マルチソース予測器を提案する。
静的オブジェクト予測器では、RGBソースは、同時に深度および静注ソースに変換される。
実験の結果,提案モデルは3つのZVOSベンチマークにおいて最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-03-18T10:19:29Z) - Ret3D: Rethinking Object Relations for Efficient 3D Object Detection in
Driving Scenes [82.4186966781934]
Ret3Dと呼ばれるシンプルで効率的で効果的な2段階検出器を導入する。
Ret3Dの中核は、新しいフレーム内およびフレーム間関係モジュールの利用である。
無視できる余分なオーバーヘッドにより、Ret3Dは最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-18T03:48:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。