論文の概要: Detecting Small Objects in Thermal Images Using Single-Shot Detector
- arxiv url: http://arxiv.org/abs/2108.11101v1
- Date: Wed, 25 Aug 2021 07:54:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-26 17:47:32.896298
- Title: Detecting Small Objects in Thermal Images Using Single-Shot Detector
- Title(参考訳): 単発検出器を用いた熱画像中の小物体検出
- Authors: Hao Zhang, Xianggong Hong, and Li Zhu
- Abstract要約: SSD(Single Shot Multibox Detector)は、高速かつ高精度な物体検出装置として最も成功した。
本稿では,小型オブジェクト検出のためのSSD上の性能向上を実現するための,新しい機能融合モジュールを備えた拡張SSDを提案する。
- 参考スコア(独自算出の注目度): 12.72157936831052
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: SSD (Single Shot Multibox Detector) is one of the most successful object
detectors for its high accuracy and fast speed. However, the features from
shallow layer (mainly Conv4_3) of SSD lack semantic information, resulting in
poor performance in small objects. In this paper, we proposed DDSSD (Dilation
and Deconvolution Single Shot Multibox Detector), an enhanced SSD with a novel
feature fusion module which can improve the performance over SSD for small
object detection. In the feature fusion module, dilation convolution module is
utilized to enlarge the receptive field of features from shallow layer and
deconvolution module is adopted to increase the size of feature maps from high
layer. Our network achieves 79.7% mAP on PASCAL VOC2007 test and 28.3% mmAP on
MS COCO test-dev at 41 FPS with only 300x300 input using a single Nvidia 1080
GPU. Especially, for small objects, DDSSD achieves 10.5% on MS COCO and 22.8%
on FLIR thermal dataset, outperforming a lot of state-of-the-art object
detection algorithms in both aspects of accuracy and speed.
- Abstract(参考訳): ssd(single shot multibox detector)は、高い精度と高速性で最も成功した物体検出器の1つである。
しかし、SSDの浅い層(主にConv4_3)の機能は意味情報を欠いているため、小さなオブジェクトでは性能が劣る。
本稿では,DDSSD(Dilation and Deconvolution Single Shot Multibox Detector)を提案する。
拡張畳み込みモジュールを用いて浅層から特徴の受容領域を拡大し、高層から特徴マップのサイズを増やすためにデコンボリューションモジュールを採用する。
我々のネットワークは、PASCAL VOC2007テストで79.7% mAP、MS COCOテストデブで28.3% mmAPを41 FPSで達成し、Nvidia 1080 GPUで300x300入力しかできない。
特に小さなオブジェクトの場合、DDSSDはMS COCOで10.5%、FLIR熱データセットで22.8%を達成し、精度と速度の両面で最先端のオブジェクト検出アルゴリズムよりも優れている。
関連論文リスト
- 3D Small Object Detection with Dynamic Spatial Pruning [62.72638845817799]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文 参考訳(メタデータ) (2023-05-05T17:57:04Z) - Fewer is More: Efficient Object Detection in Large Aerial Images [59.683235514193505]
本稿では,検出者がより少ないパッチに注目するのに対して,より効率的な推論とより正確な結果を得るのに役立つObjectness Activation Network(OAN)を提案する。
OANを用いて、5つの検出器は3つの大規模な空中画像データセットで30.0%以上のスピードアップを取得する。
我々はOANをドライブシーン物体検出と4Kビデオ物体検出に拡張し,検出速度をそれぞれ112.1%,75.0%向上させた。
論文 参考訳(メタデータ) (2022-12-26T12:49:47Z) - Precise Single-stage Detector [2.2719729705587155]
我々は、PSSD(Precise Single Stage Detector)と呼ばれるシングルショットマルチボックス検出器(SSD)の修正版を提案する。
このような問題に対処するため,我々はPSSD(Precise Single Stage Detector)と呼ばれる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-09T12:58:37Z) - DPNet: Dual-Path Network for Real-time Object Detection with Lightweight
Attention [15.360769793764526]
本稿では,リアルタイム物体検出のための軽量アテンション方式を用いて,DPNetというデュアルパスネットワークを提案する。
DPNetは、検出精度と実装効率の間の最先端のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-09-28T09:11:01Z) - ETAD: A Unified Framework for Efficient Temporal Action Detection [70.21104995731085]
時間的行動検出(TAD)のようなトリミングされていないビデオ理解は、しばしば計算資源に対する膨大な需要の苦痛に悩まされる。
我々は、効率的なエンド・ツー・エンドの時間的行動検出(ETAD)のための統合されたフレームワークを構築している。
ETADはTHUMOS-14とActivityNet-1.3の両方で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-05-14T21:16:21Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - EAutoDet: Efficient Architecture Search for Object Detection [110.99532343155073]
EAutoDetフレームワークは、1.4GPU日でオブジェクト検出のための実用的なバックボーンとFPNアーキテクチャを検出できる。
本稿では,一方のエッジ上での候補演算の重みを共有し,それらを一つの畳み込みに集約することでカーネル再利用手法を提案する。
特に、発見されたアーキテクチャは最先端のオブジェクト検出NAS法を超越し、120 FPSで40.1 mAP、49.2 mAP、41.3 FPSをCOCOテストデブセットで達成している。
論文 参考訳(メタデータ) (2022-03-21T05:56:12Z) - VPFNet: Improving 3D Object Detection with Virtual Point based LiDAR and
Stereo Data Fusion [62.24001258298076]
VPFNetは、ポイントクラウドとイメージデータを仮想のポイントで巧みに調整し集約する新しいアーキテクチャである。
当社のVPFNetは,KITTIテストセットで83.21%の中等度3D AP,91.86%中等度BEV APを達成し,2021年5月21日以来の1位となった。
論文 参考訳(メタデータ) (2021-11-29T08:51:20Z) - Small Object Detection Based on Modified FSSD and Model Compression [7.387639662781843]
本稿では,FSSDに基づく小型物体検出アルゴリズムを提案する。
計算コストと記憶空間を削減するため, モデル圧縮を実現するためにプルーニングを行う。
アルゴリズムの平均精度(mAP)は、PASCAL VOCで80.4%、GTX1080tiで59.5 FPSに達する。
論文 参考訳(メタデータ) (2021-08-24T03:20:32Z) - DeepSperm: A robust and real-time bull sperm-cell detection in densely
populated semen videos [26.494850349599528]
この研究はDeepSpermと呼ばれるアーキテクチャを提案し、課題を解決し、最先端のアーキテクチャよりも正確で高速である。
実験では,テストデータセット上で86.91 mAP,処理速度50.3 fpsを達成した。
論文 参考訳(メタデータ) (2020-03-03T09:05:05Z) - FSSD: Feature Fusion Single Shot Multibox Detector [8.016875965887815]
FSSD(Feature Fusion Single Shot Multibox Detector)は、新しい軽量機能融合モジュールを備えた拡張SSDである。
我々のネットワークは、Nvidia 1080Ti GPUを使用して、入力サイズ300$times$300の65.8 FPS(秒間フレーム)で82.7 mAP(平均精度)を達成することができる。
論文 参考訳(メタデータ) (2017-12-04T09:05:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。