論文の概要: Compact recurrent neural networks for acoustic event detection on
low-energy low-complexity platforms
- arxiv url: http://arxiv.org/abs/2001.10876v1
- Date: Wed, 29 Jan 2020 14:56:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 21:37:37.953745
- Title: Compact recurrent neural networks for acoustic event detection on
low-energy low-complexity platforms
- Title(参考訳): 低エネルギー低複雑プラットフォームにおける音響イベント検出のためのコンパクトリカレントニューラルネットワーク
- Authors: Gianmarco Cerutti, Rahul Prasad, Alessio Brutti, and Elisabetta
Farella
- Abstract要約: 本稿では,IoT 用リソース制約組込みプラットフォームにおける深層学習手法を最適化することにより,エッジでの音声イベント検出の適用について述べる。
2段階の学生-教師のアプローチは、現在のマイクロコントローラに適合する音のイベント検出のための最先端のニューラルネットワークを実現するために提案される。
組込み実装はUrbansound8kの認識精度を68%向上させることができる。
- 参考スコア(独自算出の注目度): 10.04812789957562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Outdoor acoustic events detection is an exciting research field but
challenged by the need for complex algorithms and deep learning techniques,
typically requiring many computational, memory, and energy resources. This
challenge discourages IoT implementation, where an efficient use of resources
is required. However, current embedded technologies and microcontrollers have
increased their capabilities without penalizing energy efficiency. This paper
addresses the application of sound event detection at the edge, by optimizing
deep learning techniques on resource-constrained embedded platforms for the
IoT. The contribution is two-fold: firstly, a two-stage student-teacher
approach is presented to make state-of-the-art neural networks for sound event
detection fit on current microcontrollers; secondly, we test our approach on an
ARM Cortex M4, particularly focusing on issues related to 8-bits quantization.
Our embedded implementation can achieve 68% accuracy in recognition on
Urbansound8k, not far from state-of-the-art performance, with an inference time
of 125 ms for each second of the audio stream, and power consumption of 5.5 mW
in just 34.3 kB of RAM.
- Abstract(参考訳): 屋外音響イベントの検出はエキサイティングな研究分野であるが、複雑なアルゴリズムやディープラーニング技術が必要であり、通常は多くの計算、メモリ、エネルギー資源を必要とする。
この課題は、リソースの効率的な利用が必要なIoT実装を妨げる。
しかし、現在の組み込み技術とマイクロコントローラは、エネルギー効率を損なうことなく能力を高めている。
本稿では,IoT 用リソース制約組込みプラットフォームにおける深層学習手法を最適化することにより,エッジでの音声イベント検出の適用について述べる。
ひとつは、2段階の学生-教師のアプローチで、現在のマイクロコントローラに適合する音のイベント検出のための最先端のニューラルネットワークを提供する、もうひとつは、ARM Cortex M4で、特に8ビット量子化に関する問題に焦点を当てたアプローチをテストする。
組み込み実装は、最新の性能とは程遠いurbansound8kでの認識において68%の精度を実現でき、オーディオストリームの毎秒125msの推論時間と、わずか34.3kbのramでの5.5mwの消費電力を実現している。
関連論文リスト
- Analog Spiking Neuron in CMOS 28 nm Towards Large-Scale Neuromorphic Processors [0.8426358786287627]
本研究では,TSMCの28nmCMOS技術を用いた低消費電力Leaky Integrate- and-Fireニューロンの設計を提案する。
製造されたニューロンは1.61 fJ/スパイクを消費し、34$mu m2$の活性領域を占有し、最大スパイク周波数は250mVで300kHzである。
論文 参考訳(メタデータ) (2024-08-14T17:51:20Z) - Evaluating Spiking Neural Network On Neuromorphic Platform For Human
Activity Recognition [2.710807780228189]
エネルギー効率と低レイテンシは、ウェアラブルAIを活用した人間の活動認識システムにとって重要な要件である。
スパイクベースのワークアウト認識システムは、従来のニューラルネットワークを備えた一般的なミリワットRISC-VベースマルチコアプロセッサGAP8に匹敵する精度を達成することができる。
論文 参考訳(メタデータ) (2023-08-01T18:59:06Z) - Braille Letter Reading: A Benchmark for Spatio-Temporal Pattern
Recognition on Neuromorphic Hardware [50.380319968947035]
近年の深層学習手法は,そのようなタスクにおいて精度が向上しているが,従来の組込みソリューションへの実装は依然として計算量が非常に高く,エネルギーコストも高い。
文字読み込みによるエッジにおける触覚パターン認識のための新しいベンチマークを提案する。
フィードフォワードとリカレントスパイキングニューラルネットワーク(SNN)を、サロゲート勾配の時間によるバックプロパゲーションを用いてオフラインでトレーニングし比較し、効率的な推論のためにIntel Loihimorphicチップにデプロイした。
LSTMは14%の精度で繰り返しSNNより優れており、Loihi上での繰り返しSNNは237倍のエネルギーである。
論文 参考訳(メタデータ) (2022-05-30T14:30:45Z) - ETAD: A Unified Framework for Efficient Temporal Action Detection [70.21104995731085]
時間的行動検出(TAD)のようなトリミングされていないビデオ理解は、しばしば計算資源に対する膨大な需要の苦痛に悩まされる。
我々は、効率的なエンド・ツー・エンドの時間的行動検出(ETAD)のための統合されたフレームワークを構築している。
ETADはTHUMOS-14とActivityNet-1.3の両方で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-05-14T21:16:21Z) - Deep Reinforcement Learning Based Multidimensional Resource Management
for Energy Harvesting Cognitive NOMA Communications [64.1076645382049]
エネルギー収穫(EH)、認知無線(CR)、非直交多重アクセス(NOMA)の組み合わせはエネルギー効率を向上させるための有望な解決策である。
本稿では,決定論的CR-NOMA IoTシステムにおけるスペクトル,エネルギー,時間資源管理について検討する。
論文 参考訳(メタデータ) (2021-09-17T08:55:48Z) - A reconfigurable neural network ASIC for detector front-end data
compression at the HL-LHC [0.40690419770123604]
ニューラルネットワークのオートエンコーダモデルを放射線耐性ASICに実装して、損失のあるデータ圧縮を行うことができる。
これは、粒子物理学アプリケーション用に設計されたニューラルネットワークの耐放射線性オンディテクタASIC実装である。
論文 参考訳(メタデータ) (2021-05-04T18:06:23Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - Sound Event Detection with Binary Neural Networks on Tightly
Power-Constrained IoT Devices [20.349809458335532]
サウンドイベント検出(SED)は、消費者およびスマートシティアプリケーションのホットトピックです。
Deep Neural Networksに基づく既存のアプローチは非常に効果的ですが、メモリ、電力、スループットの面で非常に要求が高いです。
本稿では,高エネルギー効率なRISC-V(8+1)コアGAP8マイクロコントローラと,極端量子化と小プリントバイナリニューラルネットワーク(BNN)の組み合わせについて検討する。
論文 参考訳(メタデータ) (2021-01-12T12:38:23Z) - ALF: Autoencoder-based Low-rank Filter-sharing for Efficient
Convolutional Neural Networks [63.91384986073851]
オートエンコーダを用いた低ランクフィルタ共有技術(ALF)を提案する。
ALFは、ネットワークパラメータの70%、オペレーションの61%、実行時間の41%を削減し、精度の低下を最小限にしている。
論文 参考訳(メタデータ) (2020-07-27T09:01:22Z) - Near-chip Dynamic Vision Filtering for Low-Bandwidth Pedestrian
Detection [99.94079901071163]
本稿では、ダイナミックビジョンセンサ(DVS)を用いた歩行者検出のための新しいエンドツーエンドシステムを提案する。
我々は、複数のセンサがローカル処理ユニットにデータを送信し、検出アルゴリズムを実行するアプリケーションをターゲットにしている。
我々の検出器は450ミリ秒毎に検出を行うことができ、総合的なテストF1スコアは83%である。
論文 参考訳(メタデータ) (2020-04-03T17:36:26Z) - Convolutional-Recurrent Neural Networks on Low-Power Wearable Platforms
for Cardiac Arrhythmia Detection [0.18459705687628122]
マイクロコントローラと低消費電力プロセッサで動作するニューラルネットワークの推論に焦点を当てる。
心不整脈を検出・分類するために既存の畳み込みリカレントニューラルネットワークを適用した。
メモリフットプリントは195.6KB、スループットは33.98MOps/sである。
論文 参考訳(メタデータ) (2020-01-08T10:35:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。