論文の概要: FasterX: Real-Time Object Detection Based on Edge GPUs for UAV
Applications
- arxiv url: http://arxiv.org/abs/2209.03157v1
- Date: Wed, 7 Sep 2022 13:52:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-08 13:01:06.872484
- Title: FasterX: Real-Time Object Detection Based on Edge GPUs for UAV
Applications
- Title(参考訳): FasterX: UAVアプリケーションのためのエッジGPUに基づくリアルタイムオブジェクト検出
- Authors: Wei Zhou, Xuanlin Min, Rui Hu, Yiwen Long, Huan Luo, and JunYi
- Abstract要約: 我々は,エッジGPU上でのリアルタイム物体検出のためのYOLOXモデルに基づく,FasterXという新しい軽量ディープラーニングアーキテクチャを提案する。
まず,YOLOXのオリジナルヘッドを代替し,小型物体のより優れた検出を行うために,有効で軽量なPixSFヘッドを設計する。
次に、SlimFPNと呼ばれるネック層のスリム構造を開発し、精度と速度のトレードオフであるネットワークのパラメータを低減する。
- 参考スコア(独自算出の注目度): 16.51060054575739
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-time object detection on Unmanned Aerial Vehicles (UAVs) is a
challenging issue due to the limited computing resources of edge GPU devices as
Internet of Things (IoT) nodes. To solve this problem, in this paper, we
propose a novel lightweight deep learning architectures named FasterX based on
YOLOX model for real-time object detection on edge GPU. First, we design an
effective and lightweight PixSF head to replace the original head of YOLOX to
better detect small objects, which can be further embedded in the depthwise
separable convolution (DS Conv) to achieve a lighter head. Then, a slimmer
structure in the Neck layer termed as SlimFPN is developed to reduce parameters
of the network, which is a trade-off between accuracy and speed. Furthermore,
we embed attention module in the Head layer to improve the feature extraction
effect of the prediction head. Meanwhile, we also improve the label assignment
strategy and loss function to alleviate category imbalance and box optimization
problems of the UAV dataset. Finally, auxiliary heads are presented for online
distillation to improve the ability of position embedding and feature
extraction in PixSF head. The performance of our lightweight models are
validated experimentally on the NVIDIA Jetson NX and Jetson Nano GPU embedded
platforms.Extensive experiments show that FasterX models achieve better
trade-off between accuracy and latency on VisDrone2021 dataset compared to
state-of-the-art models.
- Abstract(参考訳): 無人航空機(UAV)上のリアルタイムオブジェクト検出は、IoT(Internet of Things)ノードとしてのエッジGPUデバイスの限られたコンピューティングリソースのため、難しい問題である。
そこで本研究では,エッジGPU上でのリアルタイム物体検出のためのYOLOXモデルに基づく,FasterXという軽量なディープラーニングアーキテクチャを提案する。
まず, 効率良く軽量なpixsfヘッドを設計し, 元のyoloxヘッドを置き換えることで, 小型物体をよりよく検出し, 奥行き分離可能な畳み込み (ds conv) に埋め込み, より軽量なヘッドを実現する。
次に、SlimFPNと呼ばれるネック層のスリム構造を開発し、精度と速度のトレードオフであるネットワークのパラメータを低減する。
さらに,ヘッド層にアテンションモジュールを埋め込んで,予測ヘッドの特性抽出効果を向上させる。
また,ラベル割当戦略と損失関数を改善し,uavデータセットのカテゴリ不均衡とボックス最適化の問題を軽減する。
最後に,オンライン蒸留のための補助ヘッドを提示し,PixSFヘッドにおける位置埋め込みと特徴抽出の能力を向上させる。
我々の軽量モデルの性能はNVIDIA Jetson NXとJetson Nano GPUの組込みプラットフォームで実験的に検証されている。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文 参考訳(メタデータ) (2024-07-02T09:33:32Z) - Object Detection in Thermal Images Using Deep Learning for Unmanned
Aerial Vehicles [0.9208007322096533]
本研究は,無人航空機が収集した熱画像中の微小物体と微小物体を認識可能なニューラルネットワークモデルを提案する。
背骨はYOLOv5の構造に基づいて開発され、最後にトランスフォーマーエンコーダが使用される。
ネックは、スライドウインドウと変圧器とを組み合わせたBI−FPNブロックを備え、予測ヘッドに入力された情報を増加させる。
論文 参考訳(メタデータ) (2024-02-13T06:40:55Z) - SATAY: A Streaming Architecture Toolflow for Accelerating YOLO Models on
FPGA Devices [48.47320494918925]
この作業は、超低レイテンシアプリケーションのために、最先端のオブジェクト検出モデルをFPGAデバイスにデプロイする際の課題に対処する。
YOLOアクセラレータにはストリーミングアーキテクチャ設計を採用しており、チップ上で完全なモデルを深くパイプライン化して実装しています。
データフロー方式でYOLOモデルの動作をサポートする新しいハードウェアコンポーネントを導入し、オンチップメモリリソースの制限に対処するために、オフチップメモリバッファリングを導入する。
論文 参考訳(メタデータ) (2023-09-04T13:15:01Z) - EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。
我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。
私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文 参考訳(メタデータ) (2023-02-15T06:05:14Z) - Rethinking Voxelization and Classification for 3D Object Detection [68.8204255655161]
LiDARポイントクラウドからの3Dオブジェクト検出の主な課題は、ネットワークの信頼性に影響を与えることなく、リアルタイムのパフォーマンスを実現することである。
本稿では,高速な動的ボキセラライザを実装することにより,ネットワークの推論速度と精度を同時に向上するソリューションを提案する。
さらに,予測対象を分類し,偽検出対象をフィルタリングする軽量検出サブヘッドモデルを提案する。
論文 参考訳(メタデータ) (2023-01-10T16:22:04Z) - DAMO-YOLO : A Report on Real-Time Object Detection Design [19.06518351354291]
本稿では,最新のYOLOシリーズよりも高速かつ高精度なオブジェクト検出手法であるDAMO-YOLOを提案する。
我々は最大エントロピーの原理で導かれるMAE-NASを用いて検出バックボーンを探索する。
「首と首のデザインでは、大首と小首の規則に従っている。」
論文 参考訳(メタデータ) (2022-11-23T17:59:12Z) - Evaluation of Thermal Imaging on Embedded GPU Platforms for Application
in Vehicular Assistance Systems [0.5156484100374058]
本研究は、スマートで安全な車両用サーマルオブジェクト検出のリアルタイム性能を評価することに焦点を当てた。
35,000以上の異なるフレームからなる新しい大規模熱データセットを取得する。
トレーニングネットワークの有効性は、様々な定量的指標を用いて、広範なテストデータに基づいて検証される。
論文 参考訳(メタデータ) (2022-01-05T15:36:25Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - ASFD: Automatic and Scalable Face Detector [129.82350993748258]
ASFD(Automatic and Scalable Face Detector)を提案する。
ASFDはニューラルアーキテクチャ検索技術の組み合わせと新たな損失設計に基づいている。
ASFD-D0は120FPS以上で動作し、MobilenetはVGA解像度の画像を撮影しています。
論文 参考訳(メタデータ) (2020-03-25T06:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。