論文の概要: DPNet: Dual-Path Network for Real-time Object Detection with Lightweight
Attention
- arxiv url: http://arxiv.org/abs/2209.13933v1
- Date: Wed, 28 Sep 2022 09:11:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 17:12:03.460589
- Title: DPNet: Dual-Path Network for Real-time Object Detection with Lightweight
Attention
- Title(参考訳): DPNet:軽量注意によるリアルタイム物体検出のためのデュアルパスネットワーク
- Authors: Quan Zhou, Huimin Shi, Weikang Xiang, Bin Kang, Xiaofu Wu and Longin
Jan Latecki
- Abstract要約: 本稿では,リアルタイム物体検出のための軽量アテンション方式を用いて,DPNetというデュアルパスネットワークを提案する。
DPNetは、検出精度と実装効率の間の最先端のトレードオフを実現する。
- 参考スコア(独自算出の注目度): 15.360769793764526
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent advances of compressing high-accuracy convolution neural networks
(CNNs) have witnessed remarkable progress for real-time object detection. To
accelerate detection speed, lightweight detectors always have few convolution
layers using single-path backbone. Single-path architecture, however, involves
continuous pooling and downsampling operations, always resulting in coarse and
inaccurate feature maps that are disadvantageous to locate objects. On the
other hand, due to limited network capacity, recent lightweight networks are
often weak in representing large scale visual data. To address these problems,
this paper presents a dual-path network, named DPNet, with a lightweight
attention scheme for real-time object detection. The dual-path architecture
enables us to parallelly extract high-level semantic features and low-level
object details. Although DPNet has nearly duplicated shape with respect to
single-path detectors, the computational costs and model size are not
significantly increased. To enhance representation capability, a lightweight
self-correlation module (LSCM) is designed to capture global interactions, with
only few computational overheads and network parameters. In neck, LSCM is
extended into a lightweight crosscorrelation module (LCCM), capturing mutual
dependencies among neighboring scale features. We have conducted exhaustive
experiments on MS COCO and Pascal VOC 2007 datasets. The experimental results
demonstrate that DPNet achieves state-of the-art trade-off between detection
accuracy and implementation efficiency. Specifically, DPNet achieves 30.5% AP
on MS COCO test-dev and 81.5% mAP on Pascal VOC 2007 test set, together mwith
nearly 2.5M model size, 1.04 GFLOPs, and 164 FPS and 196 FPS for 320 x 320
input images of two datasets.
- Abstract(参考訳): 高精度畳み込みニューラルネットワーク(CNN)の最近の進歩は、リアルタイム物体検出において顕著な進歩をみせた。
検出速度を高速化するため、軽量検出器は常にシングルパスバックボーンを使用した畳み込み層がほとんどない。
しかし、シングルパスアーキテクチャは、連続的なプーリングとダウンサンプリング操作を伴い、常にオブジェクトを見つけるのに不利な粗末で不正確なフィーチャマップをもたらす。
一方、ネットワーク容量が限られているため、最近の軽量ネットワークは大規模な視覚データを表現できないことが多い。
これらの問題に対処するために,DPNetという2経路ネットワークを提案し,リアルタイム物体検出のための軽量なアテンション方式を提案する。
デュアルパスアーキテクチャにより、高レベルのセマンティック特徴と低レベルのオブジェクト詳細を並列に抽出できる。
DPNetはシングルパス検出器に対してほぼ重複した形状であるが、計算コストとモデルサイズは大幅に向上しない。
表現能力を高めるために、軽量自己相関モジュール(LSCM)は、計算オーバーヘッドやネットワークパラメータが少なく、グローバルな相互作用を捉えるように設計されている。
LSCMは軽量な相互相関モジュール(LCCM)に拡張され、近隣の大規模特徴間の相互依存を捉える。
我々はMS COCOとPascal VOC 2007データセットで徹底的な実験を行った。
実験の結果,DPNetは検出精度と実装効率のトレードオフを達成できることがわかった。
具体的には、DPNetはMS COCOテストデブで30.5%のAP、Pascal VOC 2007テストセットで81.5%のmAP、約2.5Mモデルサイズ、1.04 GFLOPs、164 FPSと196 FPSで2つのデータセットの320 x 320入力イメージを実現している。
関連論文リスト
- BAFNet: Bilateral Attention Fusion Network for Lightweight Semantic Segmentation of Urban Remote Sensing Images [6.153725909241752]
本研究では,高分解能な都市リモートセンシング画像の分割を効率的に行うために,両側注意融合ネットワーク(BAFNet)と呼ばれる軽量なセマンティックセマンティックセマンティクスネットワークを提案する。
BAFNetは高度な軽量モデルを精度で上回るが、2つのデータセット上の非軽量な最先端メソッドに匹敵するパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-09-16T13:25:42Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Lightweight Salient Object Detection in Optical Remote-Sensing Images
via Semantic Matching and Edge Alignment [61.45639694373033]
セマンティックマッチングとエッジアライメントに基づく光リモートセンシング画像(ORSI-SOD)のための新しい軽量ネットワークSeaNetを提案する。
具体的には、機能抽出のための軽量MobileNet-V2、高レベルの機能のための動的セマンティックマッチングモジュール(DSMM)、推論のためのポータブルデコーダが含まれる。
論文 参考訳(メタデータ) (2023-01-07T04:33:51Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - Lightweight Salient Object Detection in Optical Remote Sensing Images
via Feature Correlation [93.80710126516405]
本稿では,これらの問題に対処する軽量ORSI-SODソリューションであるCorrNetを提案する。
それぞれのコンポーネントのパラメータと計算を減らし、CorrNetは4.09Mのパラメータしか持たず、21.09GのFLOPで実行している。
2つの公開データセットの実験結果から、私たちの軽量なCorrNetは、26の最先端メソッドと比較して、競争力やパフォーマンスがさらに向上することが示された。
論文 参考訳(メタデータ) (2022-01-20T08:28:01Z) - DPNET: Dual-Path Network for Efficient Object Detectioj with Lightweight
Self-Attention [16.13989397708127]
DPNetは、軽量な自己注意を伴う効率的なオブジェクト検出のためのデュアルパスネットワークである。
COCOデータセットでは29.0%のAPを達成し、320x320の画像に対して1.14 GFLOPと2.27Mモデルサイズしか達成していない。
論文 参考訳(メタデータ) (2021-10-31T13:38:16Z) - Dense Dual-Path Network for Real-time Semantic Segmentation [7.8381744043673045]
本稿では,資源制約下でのリアルタイムセマンティックセグメンテーションのための新しいDual-Path Network(DDPNet)を提案する。
DDPNetは、GTX 1080Tiカードの1024 X 2048解像度の入力に対して52.6 FPSで75.3% mIoUを達成した。
論文 参考訳(メタデータ) (2020-10-21T06:11:41Z) - Binary DAD-Net: Binarized Driveable Area Detection Network for
Autonomous Driving [94.40107679615618]
本稿では,二項化駆動型領域検出ネットワーク(バイナリDAD-Net)を提案する。
エンコーダ、ボトルネック、デコーダ部分の2重みとアクティベーションのみを使用する。
パブリックデータセット上で、最先端のセマンティックセグメンテーションネットワークより優れています。
論文 参考訳(メタデータ) (2020-06-15T07:09:01Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。