論文の概要: Efficient Arabic emotion recognition using deep neural networks
- arxiv url: http://arxiv.org/abs/2011.00346v1
- Date: Sat, 31 Oct 2020 19:39:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 04:57:20.478785
- Title: Efficient Arabic emotion recognition using deep neural networks
- Title(参考訳): ディープニューラルネットワークを用いたアラビア語感情認識
- Authors: Ahmed Ali, Yasser Hifny
- Abstract要約: 音声信号からの感情認識の問題に対処するために,2つのニューラルアーキテクチャを実装した。
1つは注意に基づくCNN-LSTM-DNNモデル、もう1つは深層CNNモデルである。
アラビア語音声の感情認識タスクの結果から,我々の革新的なアプローチが大きな改善をもたらす可能性が示唆された。
- 参考スコア(独自算出の注目度): 21.379338888447602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emotion recognition from speech signal based on deep learning is an active
research area. Convolutional neural networks (CNNs) may be the dominant method
in this area. In this paper, we implement two neural architectures to address
this problem. The first architecture is an attention-based CNN-LSTM-DNN model.
In this novel architecture, the convolutional layers extract salient features
and the bi-directional long short-term memory (BLSTM) layers handle the
sequential phenomena of the speech signal. This is followed by an attention
layer, which extracts a summary vector that is fed to the fully connected dense
layer (DNN), which finally connects to a softmax output layer. The second
architecture is based on a deep CNN model. The results on an Arabic speech
emotion recognition task show that our innovative approach can lead to
significant improvements (2.2% absolute improvements) over a strong deep CNN
baseline system. On the other hand, the deep CNN models are significantly
faster than the attention based CNN-LSTM-DNN models in training and
classification.
- Abstract(参考訳): 深層学習に基づく音声信号からの感情認識は活発な研究領域である。
畳み込みニューラルネットワーク(CNN)がこの領域で支配的な手法である可能性がある。
本稿では,この問題に対処する2つのニューラルアーキテクチャを実装する。
最初のアーキテクチャは注意に基づくCNN-LSTM-DNNモデルである。
本アーキテクチャでは,畳み込み層が有意な特徴を抽出し,双方向長短記憶層(blstm)が音声信号の逐次現象を処理する。
注意層は、完全に連結された高密度層(DNN)に供給される要約ベクトルを抽出し、最終的にソフトマックス出力層に接続する。
第2のアーキテクチャは、ディープCNNモデルに基づいている。
アラビア語の音声感情認識タスクの結果、我々の革新的アプローチは、強力な深層cnnベースラインシステムに対する大幅な改善(2.2%の絶対的改善)につながることが示された。
一方、深層CNNモデルは、トレーニングや分類において注意に基づくCNN-LSTM-DNNモデルよりもはるかに高速である。
関連論文リスト
- CNN2GNN: How to Bridge CNN with GNN [59.42117676779735]
蒸留によりCNNとGNNを統一する新しいCNN2GNNフレームワークを提案する。
Mini-ImageNetにおける蒸留ブースターの2層GNNの性能は、ResNet152のような数十層を含むCNNよりもはるかに高い。
論文 参考訳(メタデータ) (2024-04-23T08:19:08Z) - Unveiling the Unseen: Identifiable Clusters in Trained Depthwise
Convolutional Kernels [56.69755544814834]
深部分離型畳み込みニューラルネットワーク(DS-CNN)の最近の進歩は、新しいアーキテクチャをもたらす。
本稿では,DS-CNNアーキテクチャのもう一つの顕著な特性を明らかにする。
論文 参考訳(メタデータ) (2024-01-25T19:05:53Z) - A Gradient Boosting Approach for Training Convolutional and Deep Neural
Networks [0.0]
グラディエントブースティング(GB)に基づく畳み込みニューラルネットワーク(CNN)とディープニューラルネットワークの訓練方法を紹介する。
提案モデルでは,同一アーキテクチャの標準CNNとDeep-NNに対して,分類精度の点で優れた性能を示す。
論文 参考訳(メタデータ) (2023-02-22T12:17:32Z) - BreakingBED -- Breaking Binary and Efficient Deep Neural Networks by
Adversarial Attacks [65.2021953284622]
CNNのホワイトボックス攻撃やブラックボックス攻撃に対する堅牢性について検討する。
結果は、蒸留されたCNN、エージェントベースの最新のprunedモデル、およびバイナライズニューラルネットワークのために示されています。
論文 参考訳(メタデータ) (2021-03-14T20:43:19Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Binary Graph Neural Networks [69.51765073772226]
グラフニューラルネットワーク(gnns)は、不規則データに対する表現学習のための強力で柔軟なフレームワークとして登場した。
本稿では,グラフニューラルネットワークのバイナライゼーションのための異なる戦略を提示し,評価する。
モデルの慎重な設計とトレーニングプロセスの制御によって、バイナリグラフニューラルネットワークは、挑戦的なベンチマークの精度において、適度なコストでトレーニングできることを示しています。
論文 参考訳(メタデータ) (2020-12-31T18:48:58Z) - Exploring Deep Hybrid Tensor-to-Vector Network Architectures for
Regression Based Speech Enhancement [53.47564132861866]
我々は、CNN-TTというハイブリッドアーキテクチャが、モデルパラメータを小さくして高品質な性能を維持することができることを見出した。
CNN-TTは、音声品質を改善するために、特徴抽出のために下部に複数の畳み込み層で構成されている。
論文 参考訳(メタデータ) (2020-07-25T22:21:05Z) - A temporal-to-spatial deep convolutional neural network for
classification of hand movements from multichannel electromyography data [0.14502611532302037]
我々は,マルチチャネルsEMGのための深部CNNにおける初期処理層の設計を提案し,評価する新しい貢献を行う。
本稿では,各sEMGチャネル上で第1層が個別に畳み込みを行い,時間的特徴を抽出する,新しい時間的空間的CNNアーキテクチャを提案する。
我々の新しいTtS CNN設計はデータベース1では66.6%、データベース2では67.8%の精度を実現している。
論文 参考訳(メタデータ) (2020-07-16T09:11:26Z) - Multichannel CNN with Attention for Text Classification [5.1545224296246275]
本稿では,テキスト分類のための注意型マルチチャネル畳み込みニューラルネットワーク(AMCNN)を提案する。
AMCNNは、単語の歴史と将来の情報を高次元表現にエンコードするために双方向長短期記憶を使用する。
ベンチマークデータセットの実験結果は、AMCNNが最先端の手法よりも優れたパフォーマンスを達成していることを示している。
論文 参考訳(メタデータ) (2020-06-29T16:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。