論文の概要: DPNET: Dual-Path Network for Efficient Object Detectioj with Lightweight
Self-Attention
- arxiv url: http://arxiv.org/abs/2111.00500v1
- Date: Sun, 31 Oct 2021 13:38:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-02 15:37:45.735073
- Title: DPNET: Dual-Path Network for Efficient Object Detectioj with Lightweight
Self-Attention
- Title(参考訳): DPNET: 軽量自己注意型効率的なオブジェクト検出のためのデュアルパスネットワーク
- Authors: Huimin Shi, Quan Zhou, Yinghao Ni, Xiaofu Wu and Longin Jan Latecki
- Abstract要約: DPNetは、軽量な自己注意を伴う効率的なオブジェクト検出のためのデュアルパスネットワークである。
COCOデータセットでは29.0%のAPを達成し、320x320の画像に対して1.14 GFLOPと2.27Mモデルサイズしか達成していない。
- 参考スコア(独自算出の注目度): 16.13989397708127
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection often costs a considerable amount of computation to get
satisfied performance, which is unfriendly to be deployed in edge devices. To
address the trade-off between computational cost and detection accuracy, this
paper presents a dual path network, named DPNet, for efficient object detection
with lightweight self-attention. In backbone, a single input/output lightweight
self-attention module (LSAM) is designed to encode global interactions between
different positions. LSAM is also extended into a multiple-inputs version in
feature pyramid network (FPN), which is employed to capture cross-resolution
dependencies in two paths. Extensive experiments on the COCO dataset
demonstrate that our method achieves state-of-the-art detection results. More
specifically, DPNet obtains 29.0% AP on COCO test-dev, with only 1.14 GFLOPs
and 2.27M model size for a 320x320 image.
- Abstract(参考訳): オブジェクト検出は、パフォーマンスを満足させるのにかなりの計算コストがかかり、エッジデバイスにデプロイするのは不都合である。
本稿では, 計算コストと検出精度のトレードオフに対処するため, 軽量な自己着脱を伴う効率的な物体検出のためのdpnetと呼ばれるデュアルパスネットワークを提案する。
backboneでは、単一の入出力軽量セルフアテンションモジュール(lsam)が、異なる位置間のグローバルな相互作用をエンコードするように設計されている。
lsamは、機能ピラミッドネットワーク(fpn)のマルチインプットバージョンにも拡張され、2つのパスでクロスレゾリューションの依存関係をキャプチャするために使用される。
COCOデータセットの大規模な実験により,本手法は最先端の検知結果が得られることを示した。
より具体的には、DPNetはCOCOテストデブで29.0%のAPを取得し、320x320画像に対して1.14 GFLOPsと2.27Mモデルサイズしか得られない。
関連論文リスト
- BAFNet: Bilateral Attention Fusion Network for Lightweight Semantic Segmentation of Urban Remote Sensing Images [6.153725909241752]
本研究では,高分解能な都市リモートセンシング画像の分割を効率的に行うために,両側注意融合ネットワーク(BAFNet)と呼ばれる軽量なセマンティックセマンティックセマンティクスネットワークを提案する。
BAFNetは高度な軽量モデルを精度で上回るが、2つのデータセット上の非軽量な最先端メソッドに匹敵するパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-09-16T13:25:42Z) - Lightweight Salient Object Detection in Optical Remote-Sensing Images
via Semantic Matching and Edge Alignment [61.45639694373033]
セマンティックマッチングとエッジアライメントに基づく光リモートセンシング画像(ORSI-SOD)のための新しい軽量ネットワークSeaNetを提案する。
具体的には、機能抽出のための軽量MobileNet-V2、高レベルの機能のための動的セマンティックマッチングモジュール(DSMM)、推論のためのポータブルデコーダが含まれる。
論文 参考訳(メタデータ) (2023-01-07T04:33:51Z) - DPNet: Dual-Path Network for Real-time Object Detection with Lightweight
Attention [15.360769793764526]
本稿では,リアルタイム物体検出のための軽量アテンション方式を用いて,DPNetというデュアルパスネットワークを提案する。
DPNetは、検出精度と実装効率の間の最先端のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-09-28T09:11:01Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - Lightweight Salient Object Detection in Optical Remote Sensing Images
via Feature Correlation [93.80710126516405]
本稿では,これらの問題に対処する軽量ORSI-SODソリューションであるCorrNetを提案する。
それぞれのコンポーネントのパラメータと計算を減らし、CorrNetは4.09Mのパラメータしか持たず、21.09GのFLOPで実行している。
2つの公開データセットの実験結果から、私たちの軽量なCorrNetは、26の最先端メソッドと比較して、競争力やパフォーマンスがさらに向上することが示された。
論文 参考訳(メタデータ) (2022-01-20T08:28:01Z) - Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images [15.404024559652534]
本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
論文 参考訳(メタデータ) (2021-12-13T14:37:20Z) - EPMF: Efficient Perception-aware Multi-sensor Fusion for 3D Semantic Segmentation [62.210091681352914]
自律運転やロボティクスなど,多くのアプリケーションを対象とした3次元セマンティックセマンティックセグメンテーションのためのマルチセンサフュージョンについて検討する。
本研究では,知覚認識型マルチセンサフュージョン(PMF)と呼ばれる協調融合方式について検討する。
本稿では,2つのモードから特徴を分離して抽出する2ストリームネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-21T10:47:26Z) - Dense Dual-Path Network for Real-time Semantic Segmentation [7.8381744043673045]
本稿では,資源制約下でのリアルタイムセマンティックセグメンテーションのための新しいDual-Path Network(DDPNet)を提案する。
DDPNetは、GTX 1080Tiカードの1024 X 2048解像度の入力に対して52.6 FPSで75.3% mIoUを達成した。
論文 参考訳(メタデータ) (2020-10-21T06:11:41Z) - A Single Stream Network for Robust and Real-time RGB-D Salient Object
Detection [89.88222217065858]
我々は、深度マップを用いて、RGBと深度の間の早期融合と中核融合を誘導する単一ストリームネットワークを設計する。
このモデルは、現在の最も軽量なモデルよりも55.5%軽く、32 FPSのリアルタイム速度で384倍の384ドルの画像を処理している。
論文 参考訳(メタデータ) (2020-07-14T04:40:14Z) - Binary DAD-Net: Binarized Driveable Area Detection Network for
Autonomous Driving [94.40107679615618]
本稿では,二項化駆動型領域検出ネットワーク(バイナリDAD-Net)を提案する。
エンコーダ、ボトルネック、デコーダ部分の2重みとアクティベーションのみを使用する。
パブリックデータセット上で、最先端のセマンティックセグメンテーションネットワークより優れています。
論文 参考訳(メタデータ) (2020-06-15T07:09:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。