論文の概要: YOLOv3 with Spatial Pyramid Pooling for Object Detection with Unmanned
Aerial Vehicles
- arxiv url: http://arxiv.org/abs/2305.12344v1
- Date: Sun, 21 May 2023 04:41:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 21:12:44.814085
- Title: YOLOv3 with Spatial Pyramid Pooling for Object Detection with Unmanned
Aerial Vehicles
- Title(参考訳): 無人航空機による物体検出のための空間ピラミッドプール型YOLOv3
- Authors: Wahyu Pebrianto, Panca Mudjirahardjo, Sholeh Hadi Pramono, Rahmadwati,
Raden Arief Setyawan
- Abstract要約: 我々は,背骨ダークネット53の端に空間ピラミッドポーリング層を追加することで,一段検出器YOLOv3の性能向上を目指す。
また, YOLOv3法の異なるバージョンについて評価を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detection with Unmanned Aerial Vehicles (UAVs) has attracted much
attention in the research field of computer vision. However, not easy to
accurately detect objects with data obtained from UAVs, which capture images
from very high altitudes, making the image dominated by small object sizes,
that difficult to detect. Motivated by that challenge, we aim to improve the
performance of the one-stage detector YOLOv3 by adding a Spatial Pyramid
Pooling (SPP) layer on the end of the backbone darknet-53 to obtain more
efficient feature extraction process in object detection tasks with UAVs. We
also conducted an evaluation study on different versions of YOLOv3 methods.
Includes YOLOv3 with SPP, YOLOv3, and YOLOv3-tiny, which we analyzed with the
VisDrone2019-Det dataset. Here we show that YOLOv3 with SPP can get results mAP
0.6% higher than YOLOv3 and 26.6% than YOLOv3-Tiny at 640x640 input scale and
is even able to maintain accuracy at different input image scales than other
versions of the YOLOv3 method. Those results prove that the addition of SPP
layers to YOLOv3 can be an efficient solution for improving the performance of
the object detection method with data obtained from UAVs.
- Abstract(参考訳): 無人航空機(UAV)による物体検出はコンピュータビジョンの研究分野で注目されている。
しかし、UAVから取得したデータを正確に検出することは容易ではなく、非常に高い高度から画像をキャプチャし、画像が小さな物体の大きさに支配されているため、検出が難しい。
この課題により,背骨ダークネット53の端に空間ピラミッドポーリング(SPP)層を追加し,UAVを用いた物体検出タスクにおいて,より効率的な特徴抽出プロセスを実現することで,一段検出器YOLOv3の性能向上を目指す。
また, YOLOv3法の異なるバージョンについて評価を行った。
YOLOv3にSPP、YOLOv3、YOLOv3-tinyを加え、VisDrone2019-Detデータセットで分析した。
ここでは, YOLOv3 と SPP を併用した YOLOv3 が YOLOv3 よりも0.6%, YOLOv3-Tiny より26.6%, 640x640 の入力スケールで YOLOv3-Tiny より高い結果が得られることを示す。
これらの結果から, YOLOv3 への SPP 層の追加は,UAV から取得したデータによる物体検出法の性能向上に有効であることが示唆された。
関連論文リスト
- What is YOLOv6? A Deep Insight into the Object Detection Model [0.0]
本研究は、YOLOv6オブジェクト検出モデルの詳細に焦点を当てている。
YOLOv6-NはNVIDIA Tesla T4 GPUで1187 FPSで37.5%APを達成した。
YOLOv6-Sは484 FPSで45.0%APに達し、PPYOLOE-S、YOLOv5-S、YOLOX-S、YOLOv8-Sといった同クラスのモデルより優れている。
論文 参考訳(メタデータ) (2024-12-17T15:26:15Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - Investigating YOLO Models Towards Outdoor Obstacle Detection For
Visually Impaired People [3.4628430044380973]
7種類のYOLOオブジェクト検出モデルが実装された。
YOLOv8は最高のモデルであることが判明し、その精度は80ドルに達し、よく知られたObstacleデータセットでは68.2%だった。
YOLO-NASは障害物検出作業に最適であることがわかった。
論文 参考訳(メタデータ) (2023-12-10T13:16:22Z) - YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [63.36722419180875]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。
私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。
私たちの作業は、他のYOLOモデルのプラグイン・アンド・プレイモジュールとしても機能します。
論文 参考訳(メタデータ) (2023-08-10T10:12:27Z) - An advanced YOLOv3 method for small object detection [2.906551456030129]
本稿では,小型物体検出のための改良型YOLOv3アルゴリズムを提案する。
提案手法では,拡張畳み込みミッシュ(DCM)モジュールをYOLOv3のバックボーンネットワークに導入する。
YOLOv3のネックネットワークでは、畳み込みブロックアテンションモジュール(CBAM)とマルチレベル融合モジュールが導入されている。
論文 参考訳(メタデータ) (2022-12-06T07:58:21Z) - VPIT: Real-time Embedded Single Object 3D Tracking Using Voxel Pseudo Images [90.60881721134656]
本稿では,Voxel Pseudo Image Tracking (VPIT) という,Voxel-based 3D Single Object Tracking (3D SOT) 手法を提案する。
KITTI追跡データセットの実験は、VPITが最速の3D SOT法であり、競合的な成功と精度の値を維持することを示している。
論文 参考訳(メタデータ) (2022-06-06T14:02:06Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - Expandable YOLO: 3D Object Detection from RGB-D Images [64.14512458954344]
本稿では,ステレオカメラから深度とカラー画像を入力する軽量物体検出器の構築を目的とする。
YOLOv3のネットワークアーキテクチャを中央から3Dに拡張することにより、深さ方向の出力が可能となる。
領域抽出結果の精度を確認するため、3次元空間におけるユニノン(IoU)の切断を導入する。
論文 参考訳(メタデータ) (2020-06-26T07:32:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。