論文の概要: EPANet: Efficient Path Aggregation Network for Underwater Fish Detection
- arxiv url: http://arxiv.org/abs/2508.00528v1
- Date: Fri, 01 Aug 2025 11:09:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-04 18:08:53.84531
- Title: EPANet: Efficient Path Aggregation Network for Underwater Fish Detection
- Title(参考訳): EPANet:水中魚類検出のための効率的な経路集約ネットワーク
- Authors: Jinsong Yang, Zeyuan Hu, Yichen Li,
- Abstract要約: 水中魚類検出(UFD)のための効率的な経路集約ネットワーク(EPANet)を提案する。
EPANetは2つの重要なコンポーネントで構成されている: 効率的な経路集約機能ピラミッドネットワーク(EPA-FPN)と、マルチスケールの多様な分割ショートパスボトルネック(MS-DDSPボトルネック)である。
ベンチマークUFDデータセットの実験では、EPANetは検出精度と推論速度の点で最先端の手法より優れていることが示されている。
- 参考スコア(独自算出の注目度): 6.6069949373696994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater fish detection (UFD) remains a challenging task in computer vision due to low object resolution, significant background interference, and high visual similarity between targets and surroundings. Existing approaches primarily focus on local feature enhancement or incorporate complex attention mechanisms to highlight small objects, often at the cost of increased model complexity and reduced efficiency. To address these limitations, we propose an efficient path aggregation network (EPANet), which leverages complementary feature integration to achieve accurate and lightweight UFD. EPANet consists of two key components: an efficient path aggregation feature pyramid network (EPA-FPN) and a multi-scale diverse-division short path bottleneck (MS-DDSP bottleneck). The EPA-FPN introduces long-range skip connections across disparate scales to improve semantic-spatial complementarity, while cross-layer fusion paths are adopted to enhance feature integration efficiency. The MS-DDSP bottleneck extends the conventional bottleneck structure by introducing finer-grained feature division and diverse convolutional operations, thereby increasing local feature diversity and representation capacity. Extensive experiments on benchmark UFD datasets demonstrate that EPANet outperforms state-of-the-art methods in terms of detection accuracy and inference speed, while maintaining comparable or even lower parameter complexity.
- Abstract(参考訳): 水中魚検出(UFD)は、低い物体分解能、大きな背景干渉、ターゲットと周囲の視覚的類似性のため、コンピュータビジョンにおいて難しい課題である。
既存のアプローチは主に、モデル複雑さの増大と効率の低下を犠牲にして、小さなオブジェクトをハイライトする、局所的な機能強化や複雑な注意機構の導入に重点を置いている。
これらの制約に対処するために,補完機能統合を活用して高精度かつ軽量なUFDを実現する,効率的な経路集約ネットワーク(EPANet)を提案する。
EPANetは、効率的なパス集約機能ピラミッドネットワーク(EPA-FPN)と、マルチスケールの多様なショートパスボトルネック(MS-DDSPボトルネック)の2つの重要なコンポーネントで構成されている。
EPA-FPNは、異なるスケールにわたる長距離スキップ接続を導入し、セマンティック空間の相補性を改善する一方、クロス層融合パスは機能統合の効率を高めるために採用されている。
MS-DDSPボトルネックは、より微細な特徴分割と多様な畳み込み操作を導入し、局所的な特徴の多様性と表現能力を高めることで、従来のボトルネック構造を拡張している。
ベンチマークUFDデータセットの大規模な実験では、EPANetは検出精度と推論速度の点で最先端の手法よりも優れており、パラメータの複雑さは同等あるいは低い。
関連論文リスト
- Residual Prior-driven Frequency-aware Network for Image Fusion [6.90874640835234]
画像融合は、高品質な融合画像を生成するために、モダリティにまたがる相補的な情報を統合することを目的としている。
本稿ではRPFNetと呼ばれる残差優先周波数対応ネットワークを提案する。
論文 参考訳(メタデータ) (2025-07-09T10:48:00Z) - SDS-Net: Shallow-Deep Synergism-detection Network for infrared small target detection [0.18641315013048293]
現在のCNNに基づく赤外小目標検出法は,浅部特徴と深部特徴の均一性を見落としている。
依存関係の関係と融合機構は、マルチレベル機能の相補性を十分に活用できない。
本稿では,マルチレベル特徴表現を効率的にモデル化する浅層深度相乗効果検出ネットワーク(SDS-Net)を提案する。
論文 参考訳(メタデータ) (2025-06-06T12:44:41Z) - Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - DRSI-Net: Dual-Residual Spatial Interaction Network for Multi-Person Pose Estimation [7.418828517897727]
本稿では,MPPEのための2次元空間相互作用ネットワーク(DRSI-Net)を提案する。
他の手法と比較して、DRSI-Netは隣接する特徴について空間的情報通信を行う。
提案したDRSI-Netは、他の最先端の手法よりも精度と複雑さが優れている。
論文 参考訳(メタデータ) (2024-02-26T15:10:22Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Transformer-based Context Condensation for Boosting Feature Pyramids in
Object Detection [77.50110439560152]
現在の物体検出器は、通常マルチレベル特徴融合(MFF)のための特徴ピラミッド(FP)モジュールを持つ。
我々は,既存のFPがより優れたMFF結果を提供するのに役立つ,新しい,効率的なコンテキストモデリング機構を提案する。
特に,包括的文脈を2種類の表現に分解・凝縮して高効率化を図っている。
論文 参考訳(メタデータ) (2022-07-14T01:45:03Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。