論文の概要: An advanced YOLOv3 method for small object detection
- arxiv url: http://arxiv.org/abs/2212.02809v3
- Date: Wed, 22 Mar 2023 04:08:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 01:19:50.138923
- Title: An advanced YOLOv3 method for small object detection
- Title(参考訳): 小物体検出のための高度なYOLOv3法
- Authors: Baokai Liu, Fengjie He, Shiqiang Du, Jiacheng Li, Wenjie Liu
- Abstract要約: 本稿では,小型物体検出のための改良型YOLOv3アルゴリズムを提案する。
提案手法では,拡張畳み込みミッシュ(DCM)モジュールをYOLOv3のバックボーンネットワークに導入する。
YOLOv3のネックネットワークでは、畳み込みブロックアテンションモジュール(CBAM)とマルチレベル融合モジュールが導入されている。
- 参考スコア(独自算出の注目度): 2.906551456030129
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Small object detection has important application value in the fields of
autonomous driving and drone scene analysis. As one of the most advanced object
detection algorithms, YOLOv3 suffers some challenges when detecting small
objects, such as the problem of detection failure of small objects and occluded
objects. To solve these problems, an improved YOLOv3 algorithm for small object
detection is proposed. In the proposed method, the dilated convolutions mish
(DCM) module is introduced into the backbone network of YOLOv3 to improve the
feature expression ability by fusing the feature maps of different receptive
fields. In the neck network of YOLOv3, the convolutional block attention module
(CBAM) and multi-level fusion module are introduced to select the important
information for small object detection in the shallow network, suppress the
uncritical information, and use the fusion module to fuse the feature maps of
different scales, so as to improve the detection accuracy of the algorithm. In
addition, the Soft-NMS and Complete-IoU (CloU) strategies are applied to
candidate frame screening, which improves the accuracy of the algorithm for the
detection of occluded objects. The ablation experiment of the MS COCO2017
object detection task proves the effectiveness of several modules introduced in
this paper for small object detection. The experimental results on the MS
COCO2017, VOC2007, and VOC2012 datasets show that the Average Precision (AP) of
this method is 16.5%, 8.71%, and 9.68% higher than that of YOLOv3,
respectively.
- Abstract(参考訳): 小型物体検出は、自律走行とドローンシーン解析の分野で重要な応用価値を持つ。
最も先進的なオブジェクト検出アルゴリズムの1つとして、YOLOv3は、小さなオブジェクトや隠蔽オブジェクトの検出失敗の問題など、小さなオブジェクトを検出する際のいくつかの課題に直面する。
これらの問題を解決するために,小型物体検出のための改良されたYOLOv3アルゴリズムを提案する。
提案手法では,拡張畳み込みミッシュ(DCM)モジュールをYOLOv3のバックボーンネットワークに導入し,異なる受容領域の特徴マップを融合させて特徴表現能力を向上させる。
YOLOv3のネックネットワークにおいて、畳み込みブロック注意モジュール(CBAM)とマルチレベル融合モジュールを導入し、浅いネットワークにおける小さな物体検出のための重要な情報を選択し、不クリティカルな情報を抑え、融合モジュールを使用して異なるスケールの特徴マップを融合させ、アルゴリズムの検出精度を向上させる。
さらに,ソフトNMSと完全IoU(CloU)戦略を候補フレームスクリーニングに適用し,隠蔽対象の検出アルゴリズムの精度を向上させる。
本論文では,MS COCO2017オブジェクト検出タスクのアブレーション実験を行い,小型物体検出のためのいくつかのモジュールの有効性を実証した。
MS COCO2017、VOC2007、VOC2012データセットの実験結果は、平均精度(AP)が16.5%、8.71%、9.68%がYOLOv3よりも高いことを示している。
関連論文リスト
- SOD-YOLOv8 -- Enhancing YOLOv8 for Small Object Detection in Traffic Scenes [1.3812010983144802]
Small Object Detection YOLOv8 (SOD-YOLOv8) は、多数の小さなオブジェクトを含むシナリオ用に設計されている。
SOD-YOLOv8は小さなオブジェクト検出を大幅に改善し、様々なメトリクスで広く使われているモデルを上回っている。
ダイナミックな現実世界の交通シーンでは、SOD-YOLOv8は様々な状況で顕著な改善を示した。
論文 参考訳(メタデータ) (2024-08-08T23:05:25Z) - DASSF: Dynamic-Attention Scale-Sequence Fusion for Aerial Object Detection [6.635903943457569]
元のYOLOアルゴリズムは、異なるスケールのターゲットを認識する能力の弱いため、全体的な検出精度が低い。
本稿では,空中画像のターゲット検出のための動的アテンションスケール系列融合アルゴリズム(DASSF)を提案する。
DASSF法をYOLOv8nと比較すると,平均平均精度(mAP)は9.2%,2.4%増加した。
論文 参考訳(メタデータ) (2024-06-18T05:26:44Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - YOLOv3 with Spatial Pyramid Pooling for Object Detection with Unmanned
Aerial Vehicles [0.0]
我々は,背骨ダークネット53の端に空間ピラミッドポーリング層を追加することで,一段検出器YOLOv3の性能向上を目指す。
また, YOLOv3法の異なるバージョンについて評価を行った。
論文 参考訳(メタデータ) (2023-05-21T04:41:52Z) - A Tri-Layer Plugin to Improve Occluded Detection [100.99802831241583]
本研究では,2段階物体検出装置の頭部検出のための単純な''モジュールを提案し,部分閉塞物体のリコールを改善する。
モジュールは、ターゲットオブジェクト、オクルーダー、オクラデーのセグメンテーションマスクの三層を予測し、それによってターゲットオブジェクトのマスクをより正確に予測することができる。
また,COCO評価データセットを構築し,部分閉塞オブジェクトと分離オブジェクトのリコール性能を測定した。
論文 参考訳(メタデータ) (2022-10-18T17:59:51Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Real-time object detection method based on improved YOLOv4-tiny [0.0]
YOLOv4-tiny は YOLOv4 に基づいて提案され,ネットワーク構造をシンプルにし,パラメータを削減する。
まず、Yolov4-tinyの2つのCSPBlockモジュールの代わりにResNet-Dネットワークで2つのResBlock-Dモジュールを使用する。
補助ネットワークの設計では、グローバルな特徴を抽出するために5x5の受容場を得るために2つの連続した3x3畳み込みを使用し、より効果的な情報を抽出するためにチャネルアテンションと空間アテンションも使用される。
論文 参考訳(メタデータ) (2020-11-09T08:26:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。