論文の概要: Environmental Sound Classification on the Edge: Deep Acoustic Networks
for Extremely Resource-Constrained Devices
- arxiv url: http://arxiv.org/abs/2103.03483v1
- Date: Fri, 5 Mar 2021 05:52:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-08 23:08:06.718161
- Title: Environmental Sound Classification on the Edge: Deep Acoustic Networks
for Extremely Resource-Constrained Devices
- Title(参考訳): エッジにおける環境音の分類 : 超資源制約型デバイスのための深層音響ネットワーク
- Authors: Md Mohaimenuzzaman, Christoph Bergmeir, Ian Thomas West and Bernd
Meyer
- Abstract要約: ESC-50で最先端のパフォーマンスを実現するオーディオ分類のためのエッジソリューションを紹介します。
まず,ESC-10 と ESC-50 に上述の精度を実現する新しい音響分類アーキテクチャ ACDNet を導入する。
97.22%の小型化と97.28%のFLOP削減にもかかわらず、圧縮ネットワークはESC-50で82.90%の精度を達成し、最先端のものにとどまっている。
- 参考スコア(独自算出の注目度): 1.290382979353427
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Significant efforts are being invested to bring the classification and
recognition powers of desktop and cloud systemsdirectly to edge devices. The
main challenge for deep learning on the edge is to handle extreme resource
constraints(memory, CPU speed and lack of GPU support). We present an edge
solution for audio classification that achieves close to state-of-the-art
performance on ESC-50, the same benchmark used to assess large, non
resource-constrained networks. Importantly, we do not specifically engineer
thenetwork for edge devices. Rather, we present a universalpipeline that
converts a large deep convolutional neuralnetwork (CNN) automatically via
compression and quantization into a network suitable for
resource-impoverishededge devices. We first introduce a new sound
classification architecture, ACDNet, that produces above state-of-the-art
accuracy on both ESC-10 and ESC-50 which are 96.75% and 87.05% respectively. We
then compress ACDNet using a novel network-independent approach to obtain an
extremely small model. Despite 97.22% size reduction and 97.28% reduction in
FLOPs, the compressed network still achieves 82.90% accuracy on ESC-50, staying
close to the state-of-the-art. Using 8-bit quantization, we deploy ACD-Net on
standard microcontroller units (MCUs). To the best of our knowledge, this is
the first time that a deep network for sound classification of 50 classes has
successfully been deployed on an edge device. While this should be of
interestin its own right, we believe it to be of particular impor-tance that
this has been achieved with a universal conver-sion pipeline rather than
hand-crafting a network for mini-mal size.
- Abstract(参考訳): デスクトップとクラウドシステムの分類と認識能力を直接エッジデバイスに持ち込むことに、重要な努力が注がれている。
エッジ上のディープラーニングの主な課題は、極端なリソース制約(メモリ、CPU速度、GPUサポートの欠如)に対処することです。
ESC-50では,大規模でリソース制約のないネットワークの評価に使用したのと同じベンチマークで,最先端の性能に近づいた音声分類のためのエッジソリューションを提案する。
重要なのは、エッジデバイス用のthenetworkを特に設計していないことです。
そこで本研究では,大規模深層畳み込みニューラルネットワーク(cnn)を圧縮と量子化によって自動的に変換するuniversalpipelineを提案する。
まず,ESC-10 と ESC-50 でそれぞれ96.75% と87.05% の精度を実現する新しい音響分類アーキテクチャ ACDNet を導入する。
次に,ネットワークに依存しない新しいアプローチを用いてACDNetを圧縮し,極めて小さなモデルを得る。
97.22%の小型化と97.28%のFLOP削減にもかかわらず、圧縮ネットワークはESC-50で82.90%の精度を達成し、最先端のものにとどまっている。
8ビット量子化を用いて,標準マイクロコントローラユニット(MCU)にACD-Netをデプロイする。
私たちの知る限りでは、エッジデバイス上で50クラスの音響分類のためのディープネットワークがうまくデプロイされたのは、これが初めてです。
これは、それ自身には興味があるはずですが、ミニマルサイズのネットワークを手作りするよりも、普遍的な収束パイプラインで達成された、特別な命令であると考えています。
関連論文リスト
- Attention-based Feature Compression for CNN Inference Offloading in Edge
Computing [93.67044879636093]
本稿では,デバイスエッジ共振器におけるCNN推論の計算負荷について検討する。
エンドデバイスにおける効率的な特徴抽出のための新しいオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
実験の結果、AECNNは中間データを約4%の精度で256倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2022-11-24T18:10:01Z) - EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for
Mobile Vision Applications [68.35683849098105]
入力テンソルを複数のチャネルグループに分割するSDTAエンコーダを導入する。
1.3Mパラメータを持つEdgeNeXtモデルでは、ImageNet-1Kで71.2%のTop-1精度を実現している。
パラメータ5.6MのEdgeNeXtモデルでは、ImageNet-1Kで79.4%のTop-1精度を実現しています。
論文 参考訳(メタデータ) (2022-06-21T17:59:56Z) - Non-deep Networks [122.77755088736865]
我々は、高性能な「非深度」ニューラルネットワークを構築することができることを示す。
並列サブストラクチャを利用することで、深さが12のネットワークが80%以上のトップ1の精度を達成できることを示す。
我々は、低遅延認識システムを構築するために、非ディープネットワークをどのように使用できるかという概念の証明を提供する。
論文 参考訳(メタデータ) (2021-10-14T18:03:56Z) - Pruning vs XNOR-Net: A Comprehensive Study on Deep Learning for Audio
Classification in Microcontrollers [1.4502611532302039]
マイクロコントローラにおけるエンドツーエンドの生音声分類のためのXNOR-Netを提案する。
XNORを用いた生音声分類は,少数のクラスに対して,通常の完全精度ネットワークに匹敵する性能を示す。
これらの知見は,標準ベンチマークを用いた生音声分類と画像分類の一致性を示す。
論文 参考訳(メタデータ) (2021-08-13T09:07:45Z) - Greedy Network Enlarging [53.319011626986004]
本稿では,計算のリアルタイム化に基づくグリーディ・ネットワーク拡大手法を提案する。
異なる段階の計算をステップバイステップで修正することで、拡張されたネットワークはMACの最適な割り当てと利用を提供する。
GhostNetへの我々の手法の適用により、最先端の80.9%と84.3%のImageNet Top-1アキュラシーを実現する。
論文 参考訳(メタデータ) (2021-07-31T08:36:30Z) - Toward Compact Deep Neural Networks via Energy-Aware Pruning [2.578242050187029]
ネットワークにおける各フィルタの重要性を核ノルム(NN)を用いて定量化する新しいエネルギー対応プルーニング手法を提案する。
FLOPの40.4/49.8%、パラメータ還元の45.9/52.9%、トップ1の精度の94.13/94.61%、CIFAR-10のResNet-56/110で競合する結果を得た。
論文 参考訳(メタデータ) (2021-03-19T15:33:16Z) - Network Automatic Pruning: Start NAP and Take a Nap [94.14675930881366]
我々は,粒度および構造化プルーニングのための統一かつ自動プルーニングフレームワークであるNAPを提案する。
ネットワークの重要でないコンポーネントを見つけ出し、異なるレイヤに対する適切な圧縮比を自動的に決定する。
使いやすさにもかかわらず、NAPは以前のプルーニング法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2021-01-17T07:09:19Z) - Sound Event Detection with Binary Neural Networks on Tightly
Power-Constrained IoT Devices [20.349809458335532]
サウンドイベント検出(SED)は、消費者およびスマートシティアプリケーションのホットトピックです。
Deep Neural Networksに基づく既存のアプローチは非常に効果的ですが、メモリ、電力、スループットの面で非常に要求が高いです。
本稿では,高エネルギー効率なRISC-V(8+1)コアGAP8マイクロコントローラと,極端量子化と小プリントバイナリニューラルネットワーク(BNN)の組み合わせについて検討する。
論文 参考訳(メタデータ) (2021-01-12T12:38:23Z) - ALF: Autoencoder-based Low-rank Filter-sharing for Efficient
Convolutional Neural Networks [63.91384986073851]
オートエンコーダを用いた低ランクフィルタ共有技術(ALF)を提案する。
ALFは、ネットワークパラメータの70%、オペレーションの61%、実行時間の41%を削減し、精度の低下を最小限にしている。
論文 参考訳(メタデータ) (2020-07-27T09:01:22Z) - Adjoined Networks: A Training Paradigm with Applications to Network
Compression [3.995047443480282]
本稿では、元のベースネットワークとより小さな圧縮ネットワークの両方を同時にトレーニングする学習パラダイムであるAdjoined Networks(AN)を紹介する。
ベースネットワークとしてResNet-50を使用すると、画像Netデータセット上の1.8Mパラメータと1.6GFLOPで71.8%のトップ-1の精度が達成される。
我々は,ニューラルネットワーク探索を用いて,より小さなネットワークの各レイヤの幅と重みを共同で学習し,ANを増強する訓練パラダイムであるDaniable Adjoined Networks (DAN)を提案する。
論文 参考訳(メタデータ) (2020-06-10T02:48:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。