論文の概要: QueryDet: Cascaded Sparse Query for Accelerating High-Resolution Small
Object Detection
- arxiv url: http://arxiv.org/abs/2103.09136v1
- Date: Tue, 16 Mar 2021 15:30:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 13:27:10.582306
- Title: QueryDet: Cascaded Sparse Query for Accelerating High-Resolution Small
Object Detection
- Title(参考訳): querydet:高分解能小型オブジェクト検出を高速化するカスケードスパースクエリ
- Authors: Chenhongyi Yang, Zehao Huang and Naiyan Wang
- Abstract要約: 特徴ピラミド系物体検出器の推論速度を高速化する新規なクエリ機構を提案する。
パイプラインはまず、低解像度特徴量上の小さな物体の粗い位置を予測し、高解像度特徴量を用いて正確な検出結果を算出する。
一般的なCOCOデータセットでは,検出mAPを1.0倍,mAPを2.0倍に改善し,高分解能推論速度を平均3.0倍に向上する。
- 参考スコア(独自算出の注目度): 17.775203579232144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While general object detection with deep learning has achieved great success
in the past few years, the performance and efficiency of detecting small
objects are far from satisfactory. The most common and effective way to promote
small object detection is to use high-resolution images or feature maps.
However, both approaches induce costly computation since the computational cost
grows squarely as the size of images and features increases. To get the best of
two worlds, we propose QueryDet that uses a novel query mechanism to accelerate
the inference speed of feature-pyramid based object detectors. The pipeline
composes two steps: it first predicts the coarse locations of small objects on
low-resolution features and then computes the accurate detection results using
high-resolution features sparsely guided by those coarse positions. In this
way, we can not only harvest the benefit of high-resolution feature maps but
also avoid useless computation for the background area. On the popular COCO
dataset, the proposed method improves the detection mAP by 1.0 and mAP-small by
2.0, and the high-resolution inference speed is improved to 3.0x on average. On
VisDrone dataset, which contains more small objects, we create a new
state-of-the-art while gaining a 2.3x high-resolution acceleration on average.
Code is available at: https://github.com/ChenhongyiYang/QueryDet-PyTorch
- Abstract(参考訳): ディープラーニングを用いた汎用物体検出は,ここ数年で大成功を収めてきたが,小型物体の検出性能と効率性は十分とは程遠い。
小型物体検出を促進する最も一般的かつ効果的な方法は、高解像度画像や特徴地図を使用することである。
しかし,画像や特徴のサイズが大きくなるにつれて計算コストが正方形に大きくなるため,どちらの手法もコストのかかる計算を誘導する。
2つの世界を最大限に活用するために,特徴ピラミドに基づくオブジェクト検出器の推論速度を高速化する新しいクエリ機構を用いたQueryDetを提案する。
まず、小さなオブジェクトの粗い位置を低解像度の機能で予測し、その後、粗い位置によってあまり誘導されない高分解能機能を使用して、正確な検出結果を計算する。
このようにして,高分解能特徴マップの利点を享受できるだけでなく,背景領域の無駄な計算を回避できる。
一般的なCOCOデータセットでは,検出mAPを1.0倍,mAPを2.0倍に改善し,高分解能推論速度を平均3.0倍に向上する。
より小さなオブジェクトを含むVisDroneデータセットでは、平均2.3倍の高分解能加速を達成しながら、新しい最先端技術を作成する。
https://github.com/chenhongyiyang/querydet-pytorch
関連論文リスト
- ESOD: Efficient Small Object Detection on High-Resolution Images [36.80623357577051]
小さなオブジェクトは通常、わずかに分散され、局所的にクラスタ化される。
画像の非対象背景領域において、大量の特徴抽出計算を無駄にする。
本稿では,検出器のバックボーンを再利用して,特徴レベルのオブジェクト探索とパッチスライシングを行う方法を提案する。
論文 参考訳(メタデータ) (2024-07-23T12:21:23Z) - YOLC: You Only Look Clusters for Tiny Object Detection in Aerial Images [33.80392696735718]
YOLC(You Only Look Clusters)は、アンカーフリーなオブジェクト検出器であるCenterNet上に構築された、効率的で効果的なフレームワークである。
大規模画像や非一様オブジェクトの分布がもたらす課題を克服するため,正確な検出のためにクラスタ領域のズームインを適応的に検索するローカルスケールモジュール(LSM)を導入する。
Visdrone 2019 と UAVDT を含む2つの航空画像データセットに対する広範な実験を行い、提案手法の有効性と優位性を実証した。
論文 参考訳(メタデータ) (2024-04-09T10:03:44Z) - SpirDet: Towards Efficient, Accurate and Lightweight Infrared Small
Target Detector [60.42293239557962]
我々は、赤外線小ターゲットの効率的な検出のための新しいアプローチであるSpirDetを提案する。
新しいデュアルブランチスパースデコーダを用いて特徴写像を復元する。
大規模な実験により、提案されたSpirDetは最先端モデルよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-02-08T05:06:14Z) - 3D Small Object Detection with Dynamic Spatial Pruning [62.72638845817799]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文 参考訳(メタデータ) (2023-05-05T17:57:04Z) - A Coarse to Fine Framework for Object Detection in High Resolution Image [8.316322664637537]
オブジェクト検出の現在のアプローチでは、高解像度画像における小さなオブジェクトや大規模な分散問題を検出することはめったにない。
本稿では,オブジェクト検出の精度を,特に小さなオブジェクトや大規模分散シーンに対して向上させる,シンプルで効率的なアプローチを提案する。
提案手法は,高分解能画像における物体の空間と情報を有効利用することにより,より効率的に検出できる。
論文 参考訳(メタデータ) (2023-03-02T13:04:33Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - Lightweight Salient Object Detection in Optical Remote Sensing Images
via Feature Correlation [93.80710126516405]
本稿では,これらの問題に対処する軽量ORSI-SODソリューションであるCorrNetを提案する。
それぞれのコンポーネントのパラメータと計算を減らし、CorrNetは4.09Mのパラメータしか持たず、21.09GのFLOPで実行している。
2つの公開データセットの実験結果から、私たちの軽量なCorrNetは、26の最先端メソッドと比較して、競争力やパフォーマンスがさらに向上することが示された。
論文 参考訳(メタデータ) (2022-01-20T08:28:01Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Analysis of voxel-based 3D object detection methods efficiency for
real-time embedded systems [93.73198973454944]
本稿では, ボクセルをベースとした2つの3次元物体検出手法について述べる。
実験の結果,これらの手法は入力点雲が遠距離にあるため,遠距離の小さな物体を検出できないことが確認できた。
この結果から,既存手法の計算のかなりの部分は,検出に寄与しないシーンの位置に着目していることが示唆された。
論文 参考訳(メタデータ) (2021-05-21T12:40:59Z) - Underwater object detection using Invert Multi-Class Adaboost with deep
learning [37.14538666012363]
小型物体検出のための新しいニューラルネットワークアーキテクチャであるSample-WeIghted hyPEr Network(SWIPENet)を提案する。
提案するSWIPENet+IMAフレームワークは,複数の最先端オブジェクト検出手法に対して,検出精度の向上を実現する。
論文 参考訳(メタデータ) (2020-05-23T15:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。