論文の概要: EmotionNet Nano: An Efficient Deep Convolutional Neural Network Design
for Real-time Facial Expression Recognition
- arxiv url: http://arxiv.org/abs/2006.15759v1
- Date: Mon, 29 Jun 2020 00:48:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 14:50:41.528513
- Title: EmotionNet Nano: An Efficient Deep Convolutional Neural Network Design
for Real-time Facial Expression Recognition
- Title(参考訳): EmotionNet Nano: リアルタイム表情認識のための効率的な深部畳み込みニューラルネットワーク設計
- Authors: James Ren Hou Lee, Linda Wang, and Alexander Wong
- Abstract要約: 本研究では,人間と機械の協調設計戦略によって構築された,効率的な深層畳み込みニューラルネットワークであるEmotionNet Nanoを提案する。
EmotionNet Nanoの2つの異なるバリエーションが提示され、それぞれがアーキテクチャと計算の複雑さと精度のトレードオフを持っている。
提案するEmotionNet Nanoネットワークは,実時間推定速度(例えば,15Wおよび30Wで$>25$ FPSと$>70$ FPS)と高エネルギー効率を実現した。
- 参考スコア(独自算出の注目度): 75.74756992992147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While recent advances in deep learning have led to significant improvements
in facial expression classification (FEC), a major challenge that remains a
bottleneck for the widespread deployment of such systems is their high
architectural and computational complexities. This is especially challenging
given the operational requirements of various FEC applications, such as safety,
marketing, learning, and assistive living, where real-time requirements on
low-cost embedded devices is desired. Motivated by this need for a compact, low
latency, yet accurate system capable of performing FEC in real-time on low-cost
embedded devices, this study proposes EmotionNet Nano, an efficient deep
convolutional neural network created through a human-machine collaborative
design strategy, where human experience is combined with machine meticulousness
and speed in order to craft a deep neural network design catered towards
real-time embedded usage. Two different variants of EmotionNet Nano are
presented, each with a different trade-off between architectural and
computational complexity and accuracy. Experimental results using the CK+
facial expression benchmark dataset demonstrate that the proposed EmotionNet
Nano networks demonstrated accuracies comparable to state-of-the-art in FEC
networks, while requiring significantly fewer parameters (e.g., 23$\times$
fewer at a higher accuracy). Furthermore, we demonstrate that the proposed
EmotionNet Nano networks achieved real-time inference speeds (e.g. $>25$ FPS
and $>70$ FPS at 15W and 30W, respectively) and high energy efficiency (e.g.
$>1.7$ images/sec/watt at 15W) on an ARM embedded processor, thus further
illustrating the efficacy of EmotionNet Nano for deployment on embedded
- Abstract(参考訳): 近年のディープラーニングの進歩は表情分類(FEC)の大幅な改善につながっているが、そのようなシステムの普及のボトルネックとして残る大きな課題は、その高いアーキテクチャと計算の複雑さである。
低コストな組み込みデバイス上でfecをリアルタイムに実行可能な、コンパクトで低レイテンシで正確なシステムの必要性に動機づけられた本研究は、人間と機械の協調設計戦略によって作成された、効率的な深層畳み込みニューラルネットワークであるemotionnet nanoを提案する。
EmotionNet Nanoの2つの異なるバリエーションが提示され、それぞれがアーキテクチャと計算の複雑さと精度のトレードオフを持っている。
CK+の表情ベンチマークデータセットを用いた実験の結果、提案したEmotionNet Nano Network は FEC ネットワークの最先端に匹敵する精度を示し、パラメータは大幅に少ない(例えば、23$\times$ より高い精度でより少ない)。
さらに,提案したEmotionNet Nano ネットワークは,ARM 組み込みプロセッサ上でのリアルタイム推論速度 (例えば $>25$ FPS と $>70$ FPS の 15W と 30W ) と高エネルギー効率 (例えば $>1.7$ image/sec/watt の 15W ) を実現し,EmotionNet Nano の組み込みデバイスへの展開の有効性を実証した。
