論文の概要: Optimizing Speech Emotion Recognition using Manta-Ray Based Feature
Selection
- arxiv url: http://arxiv.org/abs/2009.08909v1
- Date: Fri, 18 Sep 2020 16:09:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 03:41:47.547169
- Title: Optimizing Speech Emotion Recognition using Manta-Ray Based Feature
Selection
- Title(参考訳): マンタ線を用いた特徴選択による音声感情の最適化
- Authors: Soham Chattopadhyay, Arijit Dey, Hritam Basak
- Abstract要約: 既存の特徴抽出手法を用いて抽出した特徴の連結により,分類精度が向上することを示す。
また,音声感情認識タスクにおけるマンタレイ最適化の新たな応用を行い,その結果を得た。
- 参考スコア(独自算出の注目度): 1.4502611532302039
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emotion recognition from audio signals has been regarded as a challenging
task in signal processing as it can be considered as a collection of static and
dynamic classification tasks. Recognition of emotions from speech data has been
heavily relied upon end-to-end feature extraction and classification using
machine learning models, though the absence of feature selection and
optimization have restrained the performance of these methods. Recent studies
have shown that Mel Frequency Cepstral Coefficients (MFCC) have been emerged as
one of the most relied feature extraction methods, though it circumscribes the
accuracy of classification with a very small feature dimension. In this paper,
we propose that the concatenation of features, extracted by using different
existing feature extraction methods can not only boost the classification
accuracy but also expands the possibility of efficient feature selection. We
have used Linear Predictive Coding (LPC) apart from the MFCC feature extraction
method, before feature merging. Besides, we have performed a novel application
of Manta Ray optimization in speech emotion recognition tasks that resulted in
a state-of-the-art result in this field. We have evaluated the performance of
our model using SAVEE and Emo-DB, two publicly available datasets. Our proposed
method outperformed all the existing methods in speech emotion analysis and
resulted in a decent result in these two datasets with a classification
accuracy of 97.06% and 97.68% respectively.
- Abstract(参考訳): 音声信号からの感情認識は、静的および動的分類タスクの集合と見なすことができるため、信号処理において難しい課題とみなされてきた。
音声データからの感情の認識は、機械学習モデルを用いたエンドツーエンドの特徴抽出と分類に大きく依存しているが、特徴選択と最適化の欠如により、これらの手法の性能が抑制されている。
近年の研究では、Mel Frequency Cepstral Coefficients (MFCC) が、非常に小さな特徴次元を持つ分類の精度を概説しながら、最も信頼性の高い特徴抽出手法の1つであることが示されている。
本稿では,既存の特徴抽出手法を用いて抽出した特徴の連結が,分類精度を向上するだけでなく,効率的な特徴選択の可能性も拡張できることを示す。
我々は,MFCC特徴抽出法とは別に線形予測符号化(LPC)を用いた。
さらに,音声感情認識タスクにおけるマンタレイ最適化の新たな応用を行い,この分野での最先端の成果を得た。
SAVEEとEmo-DBという2つの公開データセットを用いてモデルの性能を評価した。
提案手法は,既存の音声感情分析手法を上回り,これら2つのデータセットの分類精度97.06%,97.68%をそれぞれ有意な結果とした。
関連論文リスト
- EMG-Based Hand Gesture Recognition through Diverse Domain Feature Enhancement and Machine Learning-Based Approach [1.8796659304823702]
表面筋電図(EMG)は手の動き認識と人間とコンピュータの相互作用において重要なツールである。
本研究では,EMG信号を用いた手動作の分類手法を提案する。
論文 参考訳(メタデータ) (2024-08-25T04:55:42Z) - Iterative Feature Boosting for Explainable Speech Emotion Recognition [17.568724398229232]
本稿では,効率的な特徴工学手法に基づく新しい教師付きSER手法を提案する。
特徴の関連性を評価し,特徴セットを洗練させるために,結果の説明可能性に特に注意を払っている。
提案手法は,TESSデータセット上での感情認識において,ヒトレベルのパフォーマンス(HLP)および最先端の機械学習手法より優れる。
論文 参考訳(メタデータ) (2024-05-30T15:44:27Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Tuning Pre-trained Model via Moment Probing [62.445281364055795]
本稿では,LP の可能性を探るため,新しい Moment Probing (MP) 法を提案する。
MPは、最終特徴の平均に基づいて線形分類ヘッドを実行する。
当社のMPはLPを著しく上回り、トレーニングコストの低い相手と競争しています。
論文 参考訳(メタデータ) (2023-07-21T04:15:02Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Automated Feature Extraction on AsMap for Emotion Classification using
EEG [0.0]
異なる脳領域の非対称性は、脳波信号の差動エントロピー(DE)特徴からAsMapと呼ばれる2次元ベクトルで捉えられる。
AsMapsは、畳み込みニューラルネットワーク(CNN)モデルを使用して、自動的に機能を抽出するために使用される。
SEEDデータセットを用いた3クラス分類問題において,97.10%の最高分類精度が達成された。
論文 参考訳(メタデータ) (2022-01-28T11:38:29Z) - A concise method for feature selection via normalized frequencies [0.0]
本稿では,普遍的特徴選択のための簡潔な手法を提案する。
提案手法は, フィルタ法とラッパー法を融合して行う。
評価結果から,提案手法は,精度,精度,リコール,Fスコア,AUCの点で,いくつかの最先端技術に優れた性能を示した。
論文 参考訳(メタデータ) (2021-06-10T15:29:54Z) - Noise-resistant Deep Metric Learning with Ranking-based Instance
Selection [59.286567680389766]
PRISM(Probabilistic Ranking-based Instance Selection with Memory)と呼ばれるDMLの耐騒音トレーニング技術を提案する。
PRISMは、ニューラルネットワークの以前のバージョンから抽出された画像特徴との平均的類似性を用いて、ミニバッチ内のノイズデータを識別する。
メモリバンクが生み出す高い計算コストを緩和するために,個々のデータポイントをクラスセンタに置き換える高速化手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T03:22:17Z) - Effect of Analysis Window and Feature Selection on Classification of
Hand Movements Using EMG Signal [0.20999222360659603]
近年,パターン認識(PR)に基づく筋電制御の研究は,機械学習分類器の助けを借りて有望な結果を示した。
複数のクラスの動きと直感的な制御を提供することで、日常的な生活運動を行うために切断対象に電力を供給することができる。
我々は,手の動きの分類精度を向上させるために,効率的なデータ前処理と最適な特徴選択が有効であることを示す。
論文 参考訳(メタデータ) (2020-02-02T19:03:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。