論文の概要: Speech Emotion Recognition Using Deep Sparse Auto-Encoder Extreme
Learning Machine with a New Weighting Scheme and Spectro-Temporal Features
Along with Classical Feature Selection and A New Quantum-Inspired Dimension
Reduction Method
- arxiv url: http://arxiv.org/abs/2111.07094v1
- Date: Sat, 13 Nov 2021 11:09:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 09:05:29.309051
- Title: Speech Emotion Recognition Using Deep Sparse Auto-Encoder Extreme
Learning Machine with a New Weighting Scheme and Spectro-Temporal Features
Along with Classical Feature Selection and A New Quantum-Inspired Dimension
Reduction Method
- Title(参考訳): 古典的特徴選択と量子インスパイアされた次元削減法と合わせて、新しい重み付け方式とスペクトル時間特徴を持つ深部スパースオートエンコーダ極端学習機を用いた音声感情認識
- Authors: Fatemeh Daneshfar, Seyed Jahanshah Kabudian
- Abstract要約: 音声信号に基づく音声感情認識システム(SER)を提案する。
このシステムは,特徴抽出,特徴選択,最後に特徴分類という3つの段階から構成される。
従来の重み付け法よりも効率的なクラス不均衡に対処する新しい重み付け法も提案されている。
- 参考スコア(独自算出の注目度): 3.8073142980733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Affective computing is very important in the relationship between man and
machine. In this paper, a system for speech emotion recognition (SER) based on
speech signal is proposed, which uses new techniques in different stages of
processing. The system consists of three stages: feature extraction, feature
selection, and finally feature classification. In the first stage, a complex
set of long-term statistics features is extracted from both the speech signal
and the glottal-waveform signal using a combination of new and diverse features
such as prosodic, spectral, and spectro-temporal features. One of the
challenges of the SER systems is to distinguish correlated emotions. These
features are good discriminators for speech emotions and increase the SER's
ability to recognize similar and different emotions. This feature vector with a
large number of dimensions naturally has redundancy. In the second stage, using
classical feature selection techniques as well as a new quantum-inspired
technique to reduce the feature vector dimensionality, the number of feature
vector dimensions is reduced. In the third stage, the optimized feature vector
is classified by a weighted deep sparse extreme learning machine (ELM)
classifier. The classifier performs classification in three steps: sparse
random feature learning, orthogonal random projection using the singular value
decomposition (SVD) technique, and discriminative classification in the last
step using the generalized Tikhonov regularization technique. Also, many
existing emotional datasets suffer from the problem of data imbalanced
distribution, which in turn increases the classification error and decreases
system performance. In this paper, a new weighting method has also been
proposed to deal with class imbalance, which is more efficient than existing
weighting methods. The proposed method is evaluated on three standard emotional
databases.
- Abstract(参考訳): 情緒的コンピューティングは人間と機械の関係において非常に重要である。
本稿では,音声信号に基づく音声感情認識(ser)システムを提案する。
このシステムは、特徴抽出、特徴選択、最後に特徴分類の3段階からなる。
第1段階では、韻律、スペクトル、スペクトル・時間的特徴など、新しく多様な特徴を組み合わせることにより、音声信号と声門波形信号の両方から、長期統計特徴の複雑な集合を抽出する。
SERシステムの課題の1つは、相関感情を区別することである。
これらの特徴は、音声の感情を識別し、類似した感情と異なる感情を認識できるSERの能力を高める。
この多数の次元を持つ特徴ベクトルは自然に冗長性を持つ。
第2段階では、古典的特徴選択技術と、特徴ベクトル次元を減少させる新しい量子インスピレーション技術を用いて、特徴ベクトル次元の数を減少させる。
第3段階では、最適化された特徴ベクトルは重み付き深絞り極端学習機械(ELM)分類器によって分類される。
分類器は、スパースランダム特徴学習、特異値分解(SVD)技術を用いた直交ランダム投影、一般化されたチコノフ正規化手法を用いた最終段階における識別的分類の3段階で分類を行う。
また、既存の感情データセットの多くは、データ不均衡分布の問題に悩まされており、それによって分類エラーが増加し、システム性能が低下する。
本稿では,既存の重み付け法よりも効率的なクラス不均衡に対処するための新しい重み付け法を提案する。
提案手法は3種類の感情データベースを用いて評価した。
関連論文リスト
- Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - A Performance-Driven Benchmark for Feature Selection in Tabular Deep
Learning [131.2910403490434]
データサイエンティストは通常、データセットにできるだけ多くの機能を集め、既存の機能から新しい機能を設計する。
既存のタブ形式の特徴選択のためのベンチマークでは、古典的な下流モデル、おもちゃの合成データセット、あるいは下流のパフォーマンスに基づいて特徴セレクタを評価していない。
変換器を含む下流ニューラルネットワーク上で評価された課題のある特徴選択ベンチマークを構築した。
また,従来の特徴選択法よりも高い性能を有するニューラルネットワークのための,Lassoのインプット・グラディエント・ベース・アナログも提案する。
論文 参考訳(メタデータ) (2023-11-10T05:26:10Z) - Training speech emotion classifier without categorical annotations [1.5609988622100528]
本研究の目的は, これら2つの表現の関係について検討することである。
提案手法は、与えられた音声の次元表現における連続値のベクトルを予測するために訓練された回帰器モデルを含む。
このモデルの出力は、マッピングアルゴリズムを用いて感情カテゴリーとして解釈できる。
論文 参考訳(メタデータ) (2022-10-14T08:47:41Z) - Selecting and combining complementary feature representations and
classifiers for hate speech detection [6.745479230590518]
ヘイトスピーチは、毎日発生する大量のデータのために、ソーシャルネットワークにおいて大きな問題である。
最近の研究は、憎しみのあるポストと単に皮肉や攻撃的な言語を区別するために必要なニュアンスを扱う機械学習(ML)の有用性を示している。
この研究は、複数の特徴抽出手法と異なる分類モデルの組み合わせが必要であると主張している。
論文 参考訳(メタデータ) (2022-01-18T03:46:49Z) - Preliminary study on using vector quantization latent spaces for TTS/VC
systems with consistent performance [55.10864476206503]
本稿では,潜在言語埋め込みをモデル化するための量子化ベクトルの利用について検討する。
トレーニングにおいて、潜伏空間上の異なるポリシーを強制することにより、潜伏言語埋め込みを得ることができる。
実験の結果,ベクトル量子化法で構築した音声クローニングシステムは,知覚的評価の点でわずかに劣化していることがわかった。
論文 参考訳(メタデータ) (2021-06-25T07:51:35Z) - Unsupervised low-rank representations for speech emotion recognition [78.38221758430244]
音声感情認識のための低ランク特徴表現の抽出に線形および非線形次元削減アルゴリズムを用いて検討する。
異なる分類法を用いて2つのデータベース上で学習した表現の音声認識(SER)結果を報告する。
論文 参考訳(メタデータ) (2021-04-14T18:30:58Z) - Does a Hybrid Neural Network based Feature Selection Model Improve Text
Classification? [9.23545668304066]
関連する特徴を得るためのハイブリッド特徴選択手法を提案する。
次に、特徴選択とニューラルネットワークパイプラインを実装する3つの方法を示す。
また,いくつかのデータセットの精度もわずかに向上した。
論文 参考訳(メタデータ) (2021-01-22T09:12:19Z) - Optimizing Speech Emotion Recognition using Manta-Ray Based Feature
Selection [1.4502611532302039]
既存の特徴抽出手法を用いて抽出した特徴の連結により,分類精度が向上することを示す。
また,音声感情認識タスクにおけるマンタレイ最適化の新たな応用を行い,その結果を得た。
論文 参考訳(メタデータ) (2020-09-18T16:09:34Z) - Any-to-Many Voice Conversion with Location-Relative Sequence-to-Sequence
Modeling [61.351967629600594]
本稿では,非並列音声変換手法である非並列音声変換法(seq2seq)を提案する。
本手法では,ボトルネック特徴抽出器(BNE)とセック2セック合成モジュールを組み合わせる。
主観的および主観的評価は,提案手法が自然性と話者類似性の両方において優れた音声変換性能を有することを示す。
論文 参考訳(メタデータ) (2020-09-06T13:01:06Z) - A Novel Community Detection Based Genetic Algorithm for Feature
Selection [3.8848561367220276]
著者らは3つのステップで機能するコミュニティ検出に基づく遺伝的アルゴリズムを提案する。
提案手法の性能から,9つのベンチマーク分類問題を解析した。
論文 参考訳(メタデータ) (2020-08-08T15:39:30Z) - Learning Class Regularized Features for Action Recognition [68.90994813947405]
本稿では,階層活性化のクラスベース正規化を行うクラス正規化手法を提案する。
動作認識に最先端CNNアーキテクチャのクラス正規化ブロックを用いることで,Kineetics,UCF-101,HMDB-51データセットにおいて,それぞれ1.8%,1.2%,1.4%の体系的改善が得られた。
論文 参考訳(メタデータ) (2020-02-07T07:27:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。