Fugu-MT 論文翻訳(概要): Compact recurrent neural networks for acoustic event detection on low-energy low-complexity platforms

論文の概要: Compact recurrent neural networks for acoustic event detection on low-energy low-complexity platforms

arxiv url: http://arxiv.org/abs/2001.10876v1
Date: Wed, 29 Jan 2020 14:56:52 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-05 21:37:37.953745
Title: Compact recurrent neural networks for acoustic event detection on low-energy low-complexity platforms
Title（参考訳）: 低エネルギー低複雑プラットフォームにおける音響イベント検出のためのコンパクトリカレントニューラルネットワーク
Authors: Gianmarco Cerutti, Rahul Prasad, Alessio Brutti, and Elisabetta Farella
Abstract要約: 本稿では,IoT 用リソース制約組込みプラットフォームにおける深層学習手法を最適化することにより,エッジでの音声イベント検出の適用について述べる。 2段階の学生-教師のアプローチは、現在のマイクロコントローラに適合する音のイベント検出のための最先端のニューラルネットワークを実現するために提案される。組込み実装はUrbansound8kの認識精度を68%向上させることができる。
参考スコア（独自算出の注目度）: 10.04812789957562
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Outdoor acoustic events detection is an exciting research field but challenged by the need for complex algorithms and deep learning techniques, typically requiring many computational, memory, and energy resources. This challenge discourages IoT implementation, where an efficient use of resources is required. However, current embedded technologies and microcontrollers have increased their capabilities without penalizing energy efficiency. This paper addresses the application of sound event detection at the edge, by optimizing deep learning techniques on resource-constrained embedded platforms for the IoT. The contribution is two-fold: firstly, a two-stage student-teacher approach is presented to make state-of-the-art neural networks for sound event detection fit on current microcontrollers; secondly, we test our approach on an ARM Cortex M4, particularly focusing on issues related to 8-bits quantization. Our embedded implementation can achieve 68% accuracy in recognition on Urbansound8k, not far from state-of-the-art performance, with an inference time of 125 ms for each second of the audio stream, and power consumption of 5.5 mW in just 34.3 kB of RAM.
Abstract（参考訳）: 屋外音響イベントの検出はエキサイティングな研究分野であるが、複雑なアルゴリズムやディープラーニング技術が必要であり、通常は多くの計算、メモリ、エネルギー資源を必要とする。この課題は、リソースの効率的な利用が必要なIoT実装を妨げる。しかし、現在の組み込み技術とマイクロコントローラは、エネルギー効率を損なうことなく能力を高めている。本稿では,IoT 用リソース制約組込みプラットフォームにおける深層学習手法を最適化することにより,エッジでの音声イベント検出の適用について述べる。ひとつは、2段階の学生-教師のアプローチで、現在のマイクロコントローラに適合する音のイベント検出のための最先端のニューラルネットワークを提供する、もうひとつは、ARM Cortex M4で、特に8ビット量子化に関する問題に焦点を当てたアプローチをテストする。組み込み実装は、最新の性能とは程遠いurbansound8kでの認識において68%の精度を実現でき、オーディオストリームの毎秒125msの推論時間と、わずか34.3kbのramでの5.5mwの消費電力を実現している。

関連論文リスト

STAR: A Privacy-Preserving, Energy-Efficient Edge AI Framework for Human Activity Recognition via Wi-Fi CSI in Mobile and Pervasive Computing Environments [0.0]
Wi-Fi Channel State Information (CSI)によるヒューマンアクティビティ認識は、スマートホーム、ヘルスケア監視、モバイルIoTシステムに適した、プライバシ保護、コンタクトレスセンシングアプローチを提供する。本稿では,軽量ニューラルネットワーク,適応信号処理,ハードウェア対応協調最適化を統合したエッジAI最適化フレームワークSTAR(Sensing Technology for Activity Recognition)を提案する。サブ秒以下の応答レイテンシと低消費電力により、リアルタイムでプライバシ保護のHARが保証され、モバイルおよび普及型コンピューティング環境に実用的なスケーラブルなソリューションを提供する。
論文参考訳（メタデータ） (2025-10-30T05:08:25Z)
End-to-End Efficiency in Keyword Spotting: A System-Level Approach for Embedded Microcontrollers [0.18472148461613155]
KWS(Keywords Spoting)は、組み込みデバイスとIoTデバイスのハンズフリーインタラクションを可能にする重要な技術である。本研究では,DS-CNN,LiCoNet,TENetなどの最先端の軽量ニューラルネットワークアーキテクチャと,MobileNet上に構築したTypman-KWSアーキテクチャを比較した。この結果から, 3つの残差ブロックを持つTKWSは, 14.4kパラメータしか持たない92.4%のF1スコアが得られることがわかった。
論文参考訳（メタデータ） (2025-09-08T16:01:55Z)
Energy-Efficient Deep Learning for Traffic Classification on Microcontrollers [1.3124513975412255]
本稿では,資源限定マイクロコントローラ上でのエネルギー効率の高いトラフィック分類のための実用的なディープラーニング(DL)手法を提案する。 ISCX VPN-Non-VPNデータセット上で96.59%の精度を実現するハードウェア対応ニューラルアーキテクチャサーチ(HW-NAS)により最適化された軽量な1D-CNNを開発する。 2つのマイクロコントローラにおける実世界の推論性能を評価する。
論文参考訳（メタデータ） (2025-06-12T16:10:22Z)
Disaggregated Deep Learning via In-Physics Computing at Radio Frequency [1.0953436973292041]
WISEは、ディープラーニング推論におけるエネルギー制約を克服するために設計された、無線エッジネットワークのための新しいコンピューティングアーキテクチャである。 165.8 TOPS/Wの計算効率に対応して、クライアントあたり6.0 fJ/MACの超低演算パワーでWISE 95.7%の画像分類精度を示す。
論文参考訳（メタデータ） (2025-04-24T17:10:18Z)
Analog Spiking Neuron in CMOS 28 nm Towards Large-Scale Neuromorphic Processors [0.8426358786287627]
本研究では,TSMCの28nmCMOS技術を用いた低消費電力Leaky Integrate- and-Fireニューロンの設計を提案する。製造されたニューロンは1.61 fJ/スパイクを消費し、34$mu m2$の活性領域を占有し、最大スパイク周波数は250mVで300kHzである。
論文参考訳（メタデータ） (2024-08-14T17:51:20Z)
Evaluating Spiking Neural Network On Neuromorphic Platform For Human Activity Recognition [2.710807780228189]
エネルギー効率と低レイテンシは、ウェアラブルAIを活用した人間の活動認識システムにとって重要な要件である。スパイクベースのワークアウト認識システムは、従来のニューラルネットワークを備えた一般的なミリワットRISC-VベースマルチコアプロセッサGAP8に匹敵する精度を達成することができる。
論文参考訳（メタデータ） (2023-08-01T18:59:06Z)
Braille Letter Reading: A Benchmark for Spatio-Temporal Pattern Recognition on Neuromorphic Hardware [50.380319968947035]
近年の深層学習手法は,そのようなタスクにおいて精度が向上しているが,従来の組込みソリューションへの実装は依然として計算量が非常に高く,エネルギーコストも高い。文字読み込みによるエッジにおける触覚パターン認識のための新しいベンチマークを提案する。フィードフォワードとリカレントスパイキングニューラルネットワーク(SNN)を、サロゲート勾配の時間によるバックプロパゲーションを用いてオフラインでトレーニングし比較し、効率的な推論のためにIntel Loihimorphicチップにデプロイした。 LSTMは14%の精度で繰り返しSNNより優れており、Loihi上での繰り返しSNNは237倍のエネルギーである。
論文参考訳（メタデータ） (2022-05-30T14:30:45Z)
ETAD: A Unified Framework for Efficient Temporal Action Detection [70.21104995731085]
時間的行動検出(TAD)のようなトリミングされていないビデオ理解は、しばしば計算資源に対する膨大な需要の苦痛に悩まされる。我々は、効率的なエンド・ツー・エンドの時間的行動検出(ETAD)のための統合されたフレームワークを構築している。 ETADはTHUMOS-14とActivityNet-1.3の両方で最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (2022-05-14T21:16:21Z)
Deep Reinforcement Learning Based Multidimensional Resource Management for Energy Harvesting Cognitive NOMA Communications [64.1076645382049]
エネルギー収穫(EH)、認知無線(CR)、非直交多重アクセス(NOMA)の組み合わせはエネルギー効率を向上させるための有望な解決策である。本稿では,決定論的CR-NOMA IoTシステムにおけるスペクトル,エネルギー,時間資源管理について検討する。
論文参考訳（メタデータ） (2021-09-17T08:55:48Z)
A reconfigurable neural network ASIC for detector front-end data compression at the HL-LHC [0.40690419770123604]
ニューラルネットワークのオートエンコーダモデルを放射線耐性ASICに実装して、損失のあるデータ圧縮を行うことができる。これは、粒子物理学アプリケーション用に設計されたニューラルネットワークの耐放射線性オンディテクタASIC実装である。
論文参考訳（メタデータ） (2021-05-04T18:06:23Z)
FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文参考訳（メタデータ） (2021-03-08T03:09:37Z)
Sound Event Detection with Binary Neural Networks on Tightly Power-Constrained IoT Devices [20.349809458335532]
サウンドイベント検出(SED)は、消費者およびスマートシティアプリケーションのホットトピックです。 Deep Neural Networksに基づく既存のアプローチは非常に効果的ですが、メモリ、電力、スループットの面で非常に要求が高いです。本稿では,高エネルギー効率なRISC-V(8+1)コアGAP8マイクロコントローラと,極端量子化と小プリントバイナリニューラルネットワーク(BNN)の組み合わせについて検討する。
論文参考訳（メタデータ） (2021-01-12T12:38:23Z)
ALF: Autoencoder-based Low-rank Filter-sharing for Efficient Convolutional Neural Networks [63.91384986073851]
オートエンコーダを用いた低ランクフィルタ共有技術(ALF)を提案する。 ALFは、ネットワークパラメータの70%、オペレーションの61%、実行時間の41%を削減し、精度の低下を最小限にしている。
論文参考訳（メタデータ） (2020-07-27T09:01:22Z)
Near-chip Dynamic Vision Filtering for Low-Bandwidth Pedestrian Detection [99.94079901071163]
本稿では、ダイナミックビジョンセンサ(DVS)を用いた歩行者検出のための新しいエンドツーエンドシステムを提案する。我々は、複数のセンサがローカル処理ユニットにデータを送信し、検出アルゴリズムを実行するアプリケーションをターゲットにしている。我々の検出器は450ミリ秒毎に検出を行うことができ、総合的なテストF1スコアは83%である。
論文参考訳（メタデータ） (2020-04-03T17:36:26Z)
Convolutional-Recurrent Neural Networks on Low-Power Wearable Platforms for Cardiac Arrhythmia Detection [0.18459705687628122]
マイクロコントローラと低消費電力プロセッサで動作するニューラルネットワークの推論に焦点を当てる。心不整脈を検出・分類するために既存の畳み込みリカレントニューラルネットワークを適用した。メモリフットプリントは195.6KB、スループットは33.98MOps/sである。
論文参考訳（メタデータ） (2020-01-08T10:35:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。