論文の概要: Q-EEGNet: an Energy-Efficient 8-bit Quantized Parallel EEGNet
Implementation for Edge Motor-Imagery Brain--Machine Interfaces
- arxiv url: http://arxiv.org/abs/2004.11690v2
- Date: Sat, 21 Nov 2020 11:11:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 04:19:59.648586
- Title: Q-EEGNet: an Energy-Efficient 8-bit Quantized Parallel EEGNet
Implementation for Edge Motor-Imagery Brain--Machine Interfaces
- Title(参考訳): Q-EEGNet:エッジモータ・イメージ脳-マシンインタフェースのためのエネルギー効率の良い8ビット量子化並列EEGNet実装
- Authors: Tibor Schneider, Xiaying Wang, Michael Hersche, Lukas Cavigelli, Luca
Benini
- Abstract要約: 運動画像脳-機械インタフェース(MI-BMI)は、人間の脳と機械間の直接的かつアクセス可能なコミュニケーションをプロミットする。
脳波信号を分類するためのディープラーニングモデルが登場した。
これらのモデルは、メモリと計算要求のため、エッジデバイスの限界を超えることが多い。
- 参考スコア(独自算出の注目度): 16.381467082472515
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motor-Imagery Brain--Machine Interfaces (MI-BMIs)promise direct and
accessible communication between human brains and machines by analyzing brain
activities recorded with Electroencephalography (EEG). Latency, reliability,
and privacy constraints make it unsuitable to offload the computation to the
cloud. Practical use cases demand a wearable, battery-operated device with low
average power consumption for long-term use. Recently, sophisticated
algorithms, in particular deep learning models, have emerged for classifying
EEG signals. While reaching outstanding accuracy, these models often exceed the
limitations of edge devices due to their memory and computational requirements.
In this paper, we demonstrate algorithmic and implementation optimizations for
EEGNET, a compact Convolutional Neural Network (CNN) suitable for many BMI
paradigms. We quantize weights and activations to 8-bit fixed-point with a
negligible accuracy loss of 0.4% on 4-class MI, and present an energy-efficient
hardware-aware implementation on the Mr.Wolf parallel ultra-low power (PULP)
System-on-Chip (SoC) by utilizing its custom RISC-V ISA extensions and 8-core
compute cluster. With our proposed optimization steps, we can obtain an overall
speedup of 64x and a reduction of up to 85% in memory footprint with respect to
a single-core layer-wise baseline implementation. Our implementation takes only
5.82 ms and consumes 0.627 mJ per inference. With 21.0GMAC/s/W, it is 256x more
energy-efficient than an EEGNET implementation on an ARM Cortex-M7
(0.082GMAC/s/W).
- Abstract(参考訳): 運動画像脳-機械インタフェース(MI-BMI)は、脳波(EEG)で記録された脳活動を分析することにより、ヒト脳と機械間の直接的かつアクセス可能なコミュニケーションを促進する。
レイテンシ、信頼性、プライバシの制約により、計算をクラウドにオフロードするのは不向きです。
実用ユースケースでは、長期使用に必要な平均消費電力が低いウェアラブルなバッテリー駆動デバイスが要求される。
近年,脳波信号分類のための高度なアルゴリズム,特に深層学習モデルが出現している。
精度は優れているが、これらのモデルはメモリと計算要求のためにエッジデバイスの限界を超えることが多い。
本稿では,多数のBMIパラダイムに適したコンパクト畳み込みニューラルネットワーク(CNN)であるEEGNETのアルゴリズムおよび実装最適化について述べる。
本稿では,8ビット固定点に対する重みとアクティベーションを4クラスmiにおける0.4%の精度損失で定量化し,独自のrisc-v isa拡張と8コア計算クラスタを用いて,mr.wolf並列超低電力(pulp)システムオンチップ(soc)上でのエネルギー効率の高いハードウェアアウェア実装を提案する。
提案する最適化ステップにより,64倍の高速化と最大85%のメモリフットプリント削減が可能となった。
我々の実装はわずか5.82msで、推論毎に0.627mJを消費する。
21.0GMAC/s/Wでは、ARM Cortex-M7(0.082GMAC/s/W)上のEEGNET実装よりも256倍エネルギー効率が高い。
関連論文リスト
- Dynamic neural network with memristive CIM and CAM for 2D and 3D vision [57.6208980140268]
本稿では,memristor を用いた意味記憶に基づく動的ニューラルネットワーク (DNN) を提案する。
ネットワークは、受信したデータとセマンティックベクターとして格納された過去の経験を関連付ける。
MNISTとModelNetのデータセットから画像と3Dポイントを分類するために、ResNetとPointNet++の40nmのmemristorマクロを用いて、我々の共同設計を検証する。
論文 参考訳(メタデータ) (2024-07-12T04:55:57Z) - A Precision-Optimized Fixed-Point Near-Memory Digital Processing Unit
for Analog In-Memory Computing [10.992736723518036]
固定点演算に基づくNMPU(Near-Memory Digital Processing Unit)を提案する。
従来の手法よりも競争精度と高い計算スループットを実現している。
我々は,AIMCチップのデータを用いてNMPUの有効性を検証するとともに,提案したNMPUを用いたシミュレーションAIMCシステムが,既存のFP16ベースの実装よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-02-12T10:30:45Z) - Pruning random resistive memory for optimizing analogue AI [54.21621702814583]
AIモデルは、エネルギー消費と環境持続可能性に前例のない課題を提示する。
有望な解決策の1つは、アナログコンピューティングを再考することである。
ここでは、構造的塑性に着想を得たエッジプルーニングを用いたユニバーサルソリューション、ソフトウェア・ハードウエアの共設計について報告する。
論文 参考訳(メタデータ) (2023-11-13T08:59:01Z) - DeepGEMM: Accelerated Ultra Low-Precision Inference on CPU Architectures
using Lookup Tables [49.965024476651706]
DeepGEMMはSIMDハードウェア上で超高精度畳み込みニューラルネットワークを実行するためのルックアップテーブルベースのアプローチである。
実装は、x86プラットフォーム上で、対応する8ビット整数カーネルを最大1.74倍の性能で上回る。
論文 参考訳(メタデータ) (2023-04-18T15:13:10Z) - FPGA-optimized Hardware acceleration for Spiking Neural Networks [69.49429223251178]
本研究は,画像認識タスクに適用したオフライントレーニングによるSNN用ハードウェアアクセラレータの開発について述べる。
この設計はXilinx Artix-7 FPGAをターゲットにしており、利用可能なハードウェアリソースの40%を合計で使用している。
分類時間を3桁に短縮し、ソフトウェアと比較すると精度にわずか4.5%の影響を与えている。
論文 参考訳(メタデータ) (2022-01-18T13:59:22Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Vega: A 10-Core SoC for IoT End-Nodes with DNN Acceleration and
Cognitive Wake-Up From MRAM-Based State-Retentive Sleep Mode [14.214500730272256]
Vegaは1.7ドルのMathrmmuWから32.2 GOPS (@ 49.4 mW)ピークまで、NSAA上でスケールアップ可能なIoTエンドノードシステムである。
ベガは8ビットINTで615 GOPS/W、32ビットと16ビットFPで79と129 GFLOPS/WのSoAリード効率を達成する。
論文 参考訳(メタデータ) (2021-10-18T08:47:45Z) - PhiNets: a scalable backbone for low-power AI at the edge [2.7910505923792646]
PhiNetsは、リソース制約のあるプラットフォーム上でのディープラーニングベースの画像処理に最適化された、スケーラブルなバックボーンである。
PhiNetは計算コスト、動作メモリ、パラメータメモリを分離するために特別に設計された逆残差ブロックに基づいている。
STM32H743マイクロコントローラをベースとしたプロトタイプノードへのアプローチを実証する。
論文 参考訳(メタデータ) (2021-10-01T12:03:25Z) - Quantized Neural Networks via {-1, +1} Encoding Decomposition and
Acceleration [83.84684675841167]
本稿では,量子化されたニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解するために,-1,+1を用いた新しい符号化方式を提案する。
本稿では,大規模画像分類,オブジェクト検出,セマンティックセグメンテーションにおける提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2021-06-18T03:11:15Z) - Sound Event Detection with Binary Neural Networks on Tightly
Power-Constrained IoT Devices [20.349809458335532]
サウンドイベント検出(SED)は、消費者およびスマートシティアプリケーションのホットトピックです。
Deep Neural Networksに基づく既存のアプローチは非常に効果的ですが、メモリ、電力、スループットの面で非常に要求が高いです。
本稿では,高エネルギー効率なRISC-V(8+1)コアGAP8マイクロコントローラと,極端量子化と小プリントバイナリニューラルネットワーク(BNN)の組み合わせについて検討する。
論文 参考訳(メタデータ) (2021-01-12T12:38:23Z) - EEG-TCNet: An Accurate Temporal Convolutional Network for Embedded
Motor-Imagery Brain-Machine Interfaces [15.07343602952606]
本稿では、トレーニング可能なパラメータをほとんど必要とせず、優れた精度を実現する新しい時間畳み込みネットワーク(TCN)であるEEG-TCNetを提案する。
メモリフットプリントが低く、推論の計算量も少ないため、エッジのリソース制限されたデバイスの組み込み分類に適している。
論文 参考訳(メタデータ) (2020-05-31T21:45:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。