論文の概要: Small Object Detection Based on Modified FSSD and Model Compression
- arxiv url: http://arxiv.org/abs/2108.10503v1
- Date: Tue, 24 Aug 2021 03:20:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-25 20:28:39.799634
- Title: Small Object Detection Based on Modified FSSD and Model Compression
- Title(参考訳): 修正FSSDとモデル圧縮に基づく小型物体検出
- Authors: Qingcai Wang, Hao Zhang, Xianggong Hong, and Qinqin Zhou
- Abstract要約: 本稿では,FSSDに基づく小型物体検出アルゴリズムを提案する。
計算コストと記憶空間を削減するため, モデル圧縮を実現するためにプルーニングを行う。
アルゴリズムの平均精度(mAP)は、PASCAL VOCで80.4%、GTX1080tiで59.5 FPSに達する。
- 参考スコア(独自算出の注目度): 7.387639662781843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Small objects have relatively low resolution, the unobvious visual features
which are difficult to be extracted, so the existing object detection methods
cannot effectively detect small objects, and the detection speed and stability
are poor. Thus, this paper proposes a small object detection algorithm based on
FSSD, meanwhile, in order to reduce the computational cost and storage space,
pruning is carried out to achieve model compression. Firstly, the semantic
information contained in the features of different layers can be used to detect
different scale objects, and the feature fusion method is improved to obtain
more information beneficial to small objects; secondly, batch normalization
layer is introduced to accelerate the training of neural network and make the
model sparse; finally, the model is pruned by scaling factor to get the
corresponding compressed model. The experimental results show that the average
accuracy (mAP) of the algorithm can reach 80.4% on PASCAL VOC and the speed is
59.5 FPS on GTX1080ti. After pruning, the compressed model can reach 79.9% mAP,
and 79.5 FPS in detection speed. On MS COCO, the best detection accuracy (APs)
is 12.1%, and the overall detection accuracy is 49.8% AP when IoU is 0.5. The
algorithm can not only improve the detection accuracy of small objects, but
also greatly improves the detection speed, which reaches a balance between
speed and accuracy.
- Abstract(参考訳): 小物体の分解能は比較的低く, 抽出が困難であり, 既存の物体検出法では小物体を効果的に検出することができず, 検出速度や安定性は低い。
そこで本研究では,FSSDに基づく小型物体検出アルゴリズムを提案する。
まず、異なるレイヤの特徴に含まれる意味情報を異なるスケールオブジェクトの検出に用いることができ、また、特徴融合法を改善して、小さなオブジェクトに有益なより多くの情報を得ることができ、第2に、ニューラルネットワークのトレーニングを加速し、モデルをスパースにするためにバッチ正規化層を導入し、最後に、スケール係数によってモデルを切断して対応する圧縮モデルを得る。
実験の結果、アルゴリズムの平均精度(mAP)はPASCAL VOCで80.4%、速度はGTX1080tiで59.5 FPSに達することが示された。
刈り取り後、圧縮されたモデルは79.9% mAP、79.5 FPSの速度で到達できる。
MS COCOでは、最良の検出精度(APs)は12.1%であり、全体的な検出精度はIoUが0.5のとき49.8%である。
このアルゴリズムは、小型物体の検出精度を向上させるだけでなく、検出速度を大幅に向上させ、速度と精度のバランスをとることができる。
関連論文リスト
- SOD-YOLOv8 -- Enhancing YOLOv8 for Small Object Detection in Traffic Scenes [1.3812010983144802]
Small Object Detection YOLOv8 (SOD-YOLOv8) は、多数の小さなオブジェクトを含むシナリオ用に設計されている。
SOD-YOLOv8は小さなオブジェクト検出を大幅に改善し、様々なメトリクスで広く使われているモデルを上回っている。
ダイナミックな現実世界の交通シーンでは、SOD-YOLOv8は様々な状況で顕著な改善を示した。
論文 参考訳(メタデータ) (2024-08-08T23:05:25Z) - KAN-RCBEVDepth: A multi-modal fusion algorithm in object detection for autonomous driving [2.382388777981433]
本稿では, 自律走行における3次元物体検出の高速化を目的としたkan-RCBEVDepth法を提案する。
我々のユニークなBird’s Eye Viewベースのアプローチは、検出精度と効率を大幅に改善します。
コードはurlhttps://www.laitiamo.com/laitiamo/RCBEVDepth-KANでリリースされる。
論文 参考訳(メタデータ) (2024-08-04T16:54:49Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Patch-based Selection and Refinement for Early Object Detection [20.838511460733038]
本稿では,イメージをパッチに分割し,様々なスケールのオブジェクトでパッチを選択し,小さなオブジェクトの詳細を精査し,できるだけ早く検出するアルゴリズムを提案する。
提案手法は変圧器を用いたネットワーク上に構築され,拡散モデルを統合して検出精度を向上させる。
提案アルゴリズムは,小型オブジェクトのmAPを1.03から8.93に向上させ,計算におけるデータボリュームを77%以上削減する。
論文 参考訳(メタデータ) (2023-11-03T23:41:13Z) - EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。
我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。
私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文 参考訳(メタデータ) (2023-02-15T06:05:14Z) - Fewer is More: Efficient Object Detection in Large Aerial Images [59.683235514193505]
本稿では,検出者がより少ないパッチに注目するのに対して,より効率的な推論とより正確な結果を得るのに役立つObjectness Activation Network(OAN)を提案する。
OANを用いて、5つの検出器は3つの大規模な空中画像データセットで30.0%以上のスピードアップを取得する。
我々はOANをドライブシーン物体検出と4Kビデオ物体検出に拡張し,検出速度をそれぞれ112.1%,75.0%向上させた。
論文 参考訳(メタデータ) (2022-12-26T12:49:47Z) - Optimizing ship detection efficiency in SAR images [12.829941550630776]
船舶検出の速度と計算コストは、違法な漁獲を防ぐための時間的介入に不可欠である。
衛星画像のデータセットを用いて,畳み込みニューラルネットワーク(CNN)に基づく物体検出モデルを訓練した。
分類モデルを用いて、検出モデルの平均精度を44%で99.5%、25%で92.7%に近似できることを示した。
論文 参考訳(メタデータ) (2022-12-12T12:04:10Z) - EAutoDet: Efficient Architecture Search for Object Detection [110.99532343155073]
EAutoDetフレームワークは、1.4GPU日でオブジェクト検出のための実用的なバックボーンとFPNアーキテクチャを検出できる。
本稿では,一方のエッジ上での候補演算の重みを共有し,それらを一つの畳み込みに集約することでカーネル再利用手法を提案する。
特に、発見されたアーキテクチャは最先端のオブジェクト検出NAS法を超越し、120 FPSで40.1 mAP、49.2 mAP、41.3 FPSをCOCOテストデブセットで達成している。
論文 参考訳(メタデータ) (2022-03-21T05:56:12Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices [13.62426382827205]
実時間物体検出器のPP-PicoDetファミリは,モバイルデバイスの物体検出において優れた性能を発揮する。
モデルは、他の一般的なモデルと比較して、精度とレイテンシのトレードオフを改善する。
論文 参考訳(メタデータ) (2021-11-01T12:53:17Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。