論文の概要: DSORT-MCU: Detecting Small Objects in Real-Time on Microcontroller Units
- arxiv url: http://arxiv.org/abs/2410.16769v1
- Date: Tue, 22 Oct 2024 07:37:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:28:51.332371
- Title: DSORT-MCU: Detecting Small Objects in Real-Time on Microcontroller Units
- Title(参考訳): DSORT-MCU:マイクロコントローラユニット上での微小物体のリアルタイム検出
- Authors: Liam Boyle, Julian Moosmann, Nicolas Baumann, Seonyeong Heo, Michele Magno,
- Abstract要約: 本稿では,YOLOモデルや一般的なFOMOネットワークを含む,軽量でエネルギー効率の高い物体検出ネットワークに対する適応型タイリング手法を提案する。
提案したタイリングにより,大規模検出モデルと比較して精度が損なわれることなく,低消費電力のMCU上で物体検出が可能となる。
- 参考スコア(独自算出の注目度): 1.4447019135112429
- License:
- Abstract: Advances in lightweight neural networks have revolutionized computer vision in a broad range of IoT applications, encompassing remote monitoring and process automation. However, the detection of small objects, which is crucial for many of these applications, remains an underexplored area in current computer vision research, particularly for low-power embedded devices that host resource-constrained processors. To address said gap, this paper proposes an adaptive tiling method for lightweight and energy-efficient object detection networks, including YOLO-based models and the popular FOMO network. The proposed tiling enables object detection on low-power MCUs with no compromise on accuracy compared to large-scale detection models. The benefit of the proposed method is demonstrated by applying it to FOMO and TinyissimoYOLO networks on a novel RISC-V-based MCU with built-in ML accelerators. Extensive experimental results show that the proposed tiling method boosts the F1-score by up to 225% for both FOMO and TinyissimoYOLO networks while reducing the average object count error by up to 76% with FOMO and up to 89% for TinyissimoYOLO. Furthermore, the findings of this work indicate that using a soft F1 loss over the popular binary cross-entropy loss can serve as an implicit non-maximum suppression for the FOMO network. To evaluate the real-world performance, the networks are deployed on the RISC-V based GAP9 microcontroller from GreenWaves Technologies, showcasing the proposed method's ability to strike a balance between detection performance ($58% - 95%$ F1 score), low latency (0.6 ms/Inference - 16.2 ms/Inference}), and energy efficiency (31 uJ/Inference} - 1.27 mJ/Inference) while performing multiple predictions using high-resolution images on a MCU.
- Abstract(参考訳): 軽量ニューラルネットワークの進歩は、リモート監視やプロセス自動化を含む、幅広いIoTアプリケーションにおいて、コンピュータビジョンに革命をもたらした。
しかし、これらのアプリケーションの多くにとって重要な小さなオブジェクトの検出は、現在のコンピュータビジョン研究において、特にリソース制約のあるプロセッサをホストする低消費電力の組み込みデバイスにおいて、未発見の領域である。
そこで本研究では,YOLOモデルや一般的なFOMOネットワークを含む,軽量でエネルギー効率のよい物体検出ネットワークのための適応型タイリング手法を提案する。
提案したタイリングにより,大規模検出モデルと比較して精度が損なわれることなく,低消費電力のMCU上で物体検出が可能となる。
提案手法の利点は,MLアクセラレータを内蔵したRISC-Vベースの新しいMCU上でFOMOおよびTinyissimoYOLOネットワークに適用できることである。
その結果,提案手法はFOMOとTinyissimoYOLOの双方でF1スコアを最大225%向上させ,FOMOでは平均オブジェクト数誤差を最大76%削減し,TinyissimoYOLOでは最大89%向上した。
さらに, FOMOネットワークにおいて, ソフトF1損失を2次クロスエントロピー損失に対して使用することにより, 暗黙の非最大抑制効果が期待できることを示す。
実世界の性能を評価するため、ネットワークはGreenWaves TechnologiesのRISC-VベースのGAP9マイクロコントローラ上に展開され、検出性能(58% - 95%$ F1スコア)、低レイテンシ(0.6 ms/推論 - 16.2 ms/推論)、エネルギー効率(31 uJ/推論} - 1.27 mJ/推論)のバランスをとることができる。
関連論文リスト
- Towards Resource-Efficient Federated Learning in Industrial IoT for Multivariate Time Series Analysis [50.18156030818883]
異常と欠落したデータは、産業応用における厄介な問題を構成する。
ディープラーニングによる異常検出が重要な方向として現れている。
エッジデバイスで収集されたデータは、ユーザのプライバシを含む。
論文 参考訳(メタデータ) (2024-11-06T15:38:31Z) - Energy-Aware FPGA Implementation of Spiking Neural Network with LIF Neurons [0.5243460995467893]
スパイキングニューラルネットワーク(SNN)は、TinyMLの最先端ソリューションとして際立っている。
本稿では,第1次Leaky Integrate-and-Fire(LIF)ニューロンモデルに基づく新しいSNNアーキテクチャを提案する。
ハードウェアフレンドリーなLIF設計も提案され、Xilinx Artix-7 FPGA上で実装されている。
論文 参考訳(メタデータ) (2024-11-03T16:42:10Z) - FedMSE: Federated learning for IoT network intrusion detection [0.0]
IoTの台頭によりサイバー攻撃面が拡大し、データ可用性、計算リソース、転送コスト、特にプライバシ保護に関する懸念から、従来の集中型機械学習手法が不十分になった。
Shrink AutoencoderとCentroid One-class Classifier(SAE-CEN)を組み合わせた半教師付きフェデレーション学習モデルを開発した。
このアプローチは,通常のネットワークデータを効果的に表現し,分散戦略における異常を正確に識別することにより侵入検知性能を向上させる。
論文 参考訳(メタデータ) (2024-10-18T02:23:57Z) - Accelerating TinyML Inference on Microcontrollers through Approximate Kernels [3.566060656925169]
本研究では、近似計算とソフトウェアカーネル設計を組み合わせることで、マイクロコントローラ上での近似CNNモデルの推定を高速化する。
CIFAR-10データセットでトレーニングされたSTM32-Nucleoボードと2つの人気のあるCNNによる評価は、最先端の正確な推測と比較すると、平均21%のレイテンシ削減が可能であることを示している。
論文 参考訳(メタデータ) (2024-09-25T11:10:33Z) - Effective Intrusion Detection in Heterogeneous Internet-of-Things Networks via Ensemble Knowledge Distillation-based Federated Learning [52.6706505729803]
我々は、分散化された侵入検知システムの共有モデル(IDS)を協調訓練するために、フェデレートラーニング(FL)を導入する。
FLEKDは従来のモデル融合法よりも柔軟な凝集法を実現する。
実験の結果,提案手法は,速度と性能の両面で,局所訓練と従来のFLよりも優れていた。
論文 参考訳(メタデータ) (2024-01-22T14:16:37Z) - Enhancing Lightweight Neural Networks for Small Object Detection in IoT
Applications [1.6932009464531739]
そこで本研究では,既存の物体検出装置上で使用可能な適応型タイリング手法を提案する。
実験の結果,提案手法はF1スコアを最大225%向上し,平均オブジェクト数誤差を最大76%削減できることがわかった。
論文 参考訳(メタデータ) (2023-11-13T08:58:34Z) - Efficient Decoder-free Object Detection with Transformers [75.00499377197475]
視覚変換器(ViT)は、物体検出アプローチのランドスケープを変化させている。
本稿では,デコーダフリー完全トランス(DFFT)オブジェクト検出器を提案する。
DFFT_SMALLは、トレーニングおよび推論段階で高い効率を達成する。
論文 参考訳(メタデータ) (2022-06-14T13:22:19Z) - Federated Learning for Energy-limited Wireless Networks: A Partial Model
Aggregation Approach [79.59560136273917]
デバイス間の限られた通信資源、帯域幅とエネルギー、およびデータ不均一性は、連邦学習(FL)の主要なボトルネックである
まず、部分モデルアグリゲーション(PMA)を用いた新しいFLフレームワークを考案する。
提案されたPMA-FLは、2つの典型的な異種データセットにおいて2.72%と11.6%の精度を改善する。
論文 参考訳(メタデータ) (2022-04-20T19:09:52Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - PhiNets: a scalable backbone for low-power AI at the edge [2.7910505923792646]
PhiNetsは、リソース制約のあるプラットフォーム上でのディープラーニングベースの画像処理に最適化された、スケーラブルなバックボーンである。
PhiNetは計算コスト、動作メモリ、パラメータメモリを分離するために特別に設計された逆残差ブロックに基づいている。
STM32H743マイクロコントローラをベースとしたプロトタイプノードへのアプローチを実証する。
論文 参考訳(メタデータ) (2021-10-01T12:03:25Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。