論文の概要: TinyissimoYOLO: A Quantized, Low-Memory Footprint, TinyML Object
Detection Network for Low Power Microcontrollers
- arxiv url: http://arxiv.org/abs/2306.00001v2
- Date: Wed, 12 Jul 2023 06:10:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-13 19:08:11.043801
- Title: TinyissimoYOLO: A Quantized, Low-Memory Footprint, TinyML Object
Detection Network for Low Power Microcontrollers
- Title(参考訳): TinyissimoYOLO:低消費電力マイクロコントローラ用量子化低メモリフットプリントTinyMLオブジェクト検出ネットワーク
- Authors: Julian Moosmann, Marco Giordano, Christian Vogt, Michele Magno
- Abstract要約: 本稿では,TinyissimoYOLOと呼ばれる,高フレキシブル,量子化,メモリ効率,超軽量な物体検出ネットワークを提案する。
畳み込みニューラルネットワークの重みを格納するための0.5MB未満のメモリで、ミリワットの電力領域におけるマイクロコントローラのオブジェクト検出を可能にすることを目的としている。
- 参考スコア(独自算出の注目度): 1.2846479438896337
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a highly flexible, quantized, memory-efficient, and
ultra-lightweight object detection network, called TinyissimoYOLO. It aims to
enable object detection on microcontrollers in the power domain of milliwatts,
with less than 0.5MB memory available for storing convolutional neural network
(CNN) weights. The proposed quantized network architecture with 422k
parameters, enables real-time object detection on embedded microcontrollers,
and it has been evaluated to exploit CNN accelerators. In particular, the
proposed network has been deployed on the MAX78000 microcontroller achieving
high frame-rate of up to 180fps and an ultra-low energy consumption of only
196{\mu}J per inference with an inference efficiency of more than 106
MAC/Cycle. TinyissimoYOLO can be trained for any multi-object detection.
However, considering the small network size, adding object detection classes
will increase the size and memory consumption of the network, thus object
detection with up to 3 classes is demonstrated. Furthermore, the network is
trained using quantization-aware training and deployed with 8-bit quantization
on different microcontrollers, such as STM32H7A3, STM32L4R9, Apollo4b and on
the MAX78000's CNN accelerator. Performance evaluations are presented in this
paper.
- Abstract(参考訳): 本稿では,高柔軟性,量子化,メモリ効率,超軽量物体検出ネットワークであるtinyissimoyoloについて述べる。
コンボリューショナルニューラルネットワーク(CNN)重みを格納するための0.5MB未満のメモリで、ミリワットの電力領域におけるマイクロコントローラのオブジェクト検出を可能にすることを目的としている。
提案した422kパラメータの量子化ネットワークアーキテクチャにより,組込みマイクロコントローラ上でのリアルタイムオブジェクト検出が可能となり,CNNアクセラレータの活用が評価されている。
特に、提案したネットワークはMAX78000マイクロコントローラ上に展開され、最大180fpsのフレームレートを実現し、106MAC/Cycleの推論効率を持つ推論当たり196{\mu}Jの超低消費電力を実現している。
TinyissimoYOLOは、任意のマルチオブジェクト検出のためにトレーニングすることができる。
しかし,ネットワークサイズが小さくなると,オブジェクト検出クラスを追加することでネットワークのサイズとメモリ消費が増加し,最大3クラスまでのオブジェクト検出が可能となる。
さらに、ネットワークは量子化学習を用いて訓練され、STM32H7A3、STM32L4R9、Apollo4b、MAX78000のCNNアクセラレータなど、様々なマイクロコントローラに8ビット量子化を施した。
本稿では,性能評価について述べる。
関連論文リスト
- DSORT-MCU: Detecting Small Objects in Real-Time on Microcontroller Units [1.4447019135112429]
本稿では,YOLOモデルや一般的なFOMOネットワークを含む,軽量でエネルギー効率の高い物体検出ネットワークに対する適応型タイリング手法を提案する。
提案したタイリングにより,大規模検出モデルと比較して精度が損なわれることなく,低消費電力のMCU上で物体検出が可能となる。
論文 参考訳(メタデータ) (2024-10-22T07:37:47Z) - An Ultra-low Power TinyML System for Real-time Visual Processing at Edge [7.327401565768275]
このブリーフィングは、様々な視覚タスクのための高効率CNNモデルを構築するために、非常に小さなバックボーンを提示する。
特別に設計されたニューラルコプロセッサ(NCP)は、超低消費電力のTinyMLシステムを構築するためにMCUと相互接続される。
我々のモデル, NCP, 命令セットに基づくTinyMLシステムは, 精度が高く, 記録的な160mW超低出力を実現している。
論文 参考訳(メタデータ) (2022-07-11T06:56:27Z) - Sparse Compressed Spiking Neural Network Accelerator for Object
Detection [0.1246030133914898]
スパイキングニューラルネットワーク(SNN)は、人間の脳にインスパイアされ、バイナリスパイクと非常にスパースなアクティベーションマップを送信する。
本稿では, 活性化マップと重みの疎度を生かした, スパース圧縮スパイクニューラルネットワーク加速器を提案する。
ニューラルネットワークの実験結果は、71.5$%$mAPで、ISV 3clsデータセットの混合(1,3)タイムステップを示している。
論文 参考訳(メタデータ) (2022-05-02T09:56:55Z) - MCUNetV2: Memory-Efficient Patch-based Inference for Tiny Deep Learning [72.80896338009579]
メモリボトルネックは畳み込みニューラルネットワーク(CNN)の設計における不均衡なメモリ分布に起因する。
本稿では,ピークメモリを大幅に削減するパッチ・バイ・パッチ・推論スケジューリングを提案する。
ニューラルアーキテクチャサーチによるプロセスを自動化し、ニューラルアーキテクチャと推論スケジューリングを共同で最適化し、MCUNetV2に導いた。
論文 参考訳(メタデータ) (2021-10-28T17:58:45Z) - NAS-FCOS: Efficient Search for Object Detection Architectures [113.47766862146389]
簡易なアンカーフリー物体検出器の特徴ピラミッドネットワーク (FPN) と予測ヘッドを探索し, より効率的な物体検出手法を提案する。
慎重に設計された検索空間、検索アルゴリズム、ネットワーク品質を評価するための戦略により、8つのV100 GPUを使用して、4日以内に最高のパフォーマンスの検知アーキテクチャを見つけることができる。
論文 参考訳(メタデータ) (2021-10-24T12:20:04Z) - A TinyML Platform for On-Device Continual Learning with Quantized Latent
Replays [66.62377866022221]
Latent Replay-based Continual Learning (CL)技術は、原則としてオンライン、サーバレスの適応を可能にする。
10コアのFP32対応並列超低消費電力プロセッサをベースとした,エンドツーエンドCLのためのHW/SWプラットフォームを提案する。
これらの手法を組み合わせることで,64MB未満のメモリを用いて連続学習を実現することができることを示す。
論文 参考訳(メタデータ) (2021-10-20T11:01:23Z) - GnetDet: Object Detection Optimized on a 224mW CNN Accelerator Chip at
the Speed of 106FPS [10.644839299403612]
CPU負荷を最小限に抑え、CNNアクセラレータチップ上のオブジェクト検出モデルを最適化する。
実験結果から, 224mW チップ上で動作する GnetDet モデルは106FPS の速度を精度良く達成できることがわかった。
論文 参考訳(メタデータ) (2021-02-19T06:16:42Z) - Sound Event Detection with Binary Neural Networks on Tightly
Power-Constrained IoT Devices [20.349809458335532]
サウンドイベント検出(SED)は、消費者およびスマートシティアプリケーションのホットトピックです。
Deep Neural Networksに基づく既存のアプローチは非常に効果的ですが、メモリ、電力、スループットの面で非常に要求が高いです。
本稿では,高エネルギー効率なRISC-V(8+1)コアGAP8マイクロコントローラと,極端量子化と小プリントバイナリニューラルネットワーク(BNN)の組み合わせについて検討する。
論文 参考訳(メタデータ) (2021-01-12T12:38:23Z) - Leveraging Automated Mixed-Low-Precision Quantization for tiny edge
microcontrollers [76.30674794049293]
本稿では、HAQフレームワークに基づく自動混合精度量子化フローを提案するが、MCUデバイスのメモリおよび計算特性に特化している。
具体的には、強化学習エージェントは、個々の重みとアクティベーションテンソルの2, 4, 8ビットのうち、最高の均一量子化レベルを探索する。
重量のみの量子化のために2MBに制限されたMCUクラスのメモリが与えられた場合、混合精度エンジンによって生成された圧縮されたモデルは、最先端のソリューションと同じくらい正確である。
論文 参考訳(メタデータ) (2020-08-12T06:09:58Z) - Near-chip Dynamic Vision Filtering for Low-Bandwidth Pedestrian
Detection [99.94079901071163]
本稿では、ダイナミックビジョンセンサ(DVS)を用いた歩行者検出のための新しいエンドツーエンドシステムを提案する。
我々は、複数のセンサがローカル処理ユニットにデータを送信し、検出アルゴリズムを実行するアプリケーションをターゲットにしている。
我々の検出器は450ミリ秒毎に検出を行うことができ、総合的なテストF1スコアは83%である。
論文 参考訳(メタデータ) (2020-04-03T17:36:26Z) - NETNet: Neighbor Erasing and Transferring Network for Better Single Shot
Object Detection [170.30694322460045]
我々は、ピラミッドの特徴を再設定し、スケールアウェアな特徴を探索する新しいNeighbor Erasing and Transferring(NET)メカニズムを提案する。
NETNetと呼ばれるシングルショットネットワークは、スケールアウェアなオブジェクト検出のために構築されている。
論文 参考訳(メタデータ) (2020-01-18T15:21:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。