論文の概要: Real-time EEG-based Emotion Recognition using Discrete Wavelet
Transforms on Full and Reduced Channel Signals
- arxiv url: http://arxiv.org/abs/2110.05635v1
- Date: Mon, 11 Oct 2021 22:28:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-13 14:45:46.511216
- Title: Real-time EEG-based Emotion Recognition using Discrete Wavelet
Transforms on Full and Reduced Channel Signals
- Title(参考訳): 離散ウェーブレット変換を用いたフルチャネル信号とダウンチャネル信号のリアルタイム脳波に基づく感情認識
- Authors: Josef Bajada and Francesco Borg Bonello
- Abstract要約: コンシューマグレードのEEGデバイスを用いたリアルタイム脳波ベースの感情認識(EEG-ER)は、チャンネル数を減らすことで感情の分類を行う。
これらのデバイスは一般的に4、5チャンネルしか提供しないが、現在の最先端の研究で一般的に使用されるチャンネルの数が多いのとは対照的である。
本稿では、離散ウェーブレット変換(DWT)を用いて時間周波数領域の特徴を抽出し、時間ウィンドウを用いてEEG-ER分類を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Real-time EEG-based Emotion Recognition (EEG-ER) with consumer-grade EEG
devices involves classification of emotions using a reduced number of channels.
These devices typically provide only four or five channels, unlike the high
number of channels (32 or more) typically used in most current state-of-the-art
research. In this work we propose to use Discrete Wavelet Transforms (DWT) to
extract time-frequency domain features, and we use time-windows of a few
seconds to perform EEG-ER classification. This technique can be used in
real-time, as opposed to post-hoc on the full session data. We also apply
baseline removal preprocessing, developed in prior research, to our proposed
DWT Entropy and Energy features, which improves classification accuracy
significantly. We consider two different classifier architectures, a 3D
Convolutional Neural Network (3D CNN) and a Support Vector Machine (SVM). We
evaluate both models on subject-independent and subject dependent setups to
classify the Valence and Arousal dimensions of an individual's emotional state.
We test them on both the full 32-channel data provided by the DEAP dataset, and
also a reduced 5-channel extract of the same dataset. The SVM model performs
best on all the presented scenarios, achieving an accuracy of 95.32% on Valence
and 95.68% on Arousal for the full 32-channel subject-dependent case, beating
prior real-time EEG-ER subject-dependent benchmarks. On the subject-independent
case an accuracy of 80.70% on Valence and 81.41% on Arousal was also obtained.
Reducing the input data to 5 channels only degrades the accuracy by an average
of 3.54% across all scenarios, making this model appropriate for use with more
accessible low-end EEG devices.
- Abstract(参考訳): コンシューマグレードのEEGデバイスを用いたリアルタイム脳波ベースの感情認識(EEG-ER)は、チャンネル数を減らすことで感情の分類を行う。
これらのデバイスは一般的に4、5チャンネルしか提供しないが、ほとんどの最先端の研究で使用される多くのチャネル(32以上のチャネル)とは異なりである。
本研究では、離散ウェーブレット変換(DWT)を用いて時間周波数領域の特徴を抽出し、時間ウィンドウを用いてEEG-ER分類を行う。
このテクニックは、フルセッションデータでのポストホックとは対照的に、リアルタイムに使用できる。
また,従来の研究で開発されたベースライン除去前処理を,分類精度を大幅に向上させるDWTエントロピー・エネルギー特性に適用した。
本稿では,3次元畳み込みニューラルネットワーク(3D CNN)とサポートベクトルマシン(SVM)の2つの異なる分類器アーキテクチャについて考察する。
個人の感情状態の妥当性と覚醒の次元を分類するために,主観的非依存と主観的依存の双方でモデルを評価する。
我々は、DEAPデータセットが提供する全32チャンネルデータと、同じデータセットの5チャンネル抽出量の両方でテストする。
SVMモデルは、提示されたすべてのシナリオで最高に機能し、Valenceでは95.32%、Arousalでは95.68%の精度で32チャンネルの主観依存のケースで、以前のリアルタイムEEG-ER主観依存のベンチマークを上回っている。
また,被験者非依存症例では,Valenceが80.70%,Arousalが81.41%であった。
入力データを5チャンネルに減らすと、すべてのシナリオで平均3.54%の精度が低下し、このモデルはよりアクセスしやすいローエンドの脳波デバイスでの使用に適している。
関連論文リスト
- Dual-TSST: A Dual-Branch Temporal-Spectral-Spatial Transformer Model for EEG Decoding [2.0721229324537833]
デュアルブランチ時間スペクトル空間変換器(Dual-TSST)を用いた新しいデコードアーキテクチャネットワークを提案する。
提案するDual-TSSTは様々なタスクにおいて優れており,平均精度80.67%の脳波分類性能が期待できる。
本研究は,高性能脳波デコーディングへの新たなアプローチを提供するとともに,将来のCNN-Transformerベースのアプリケーションにも大きな可能性を秘めている。
論文 参考訳(メタデータ) (2024-09-05T05:08:43Z) - Hourglass Tokenizer for Efficient Transformer-Based 3D Human Pose Estimation [73.31524865643709]
本稿では,Hourglass Tokenizer (HoT) と呼ばれるプラグアンドプレイのプルーニング・アンド・リカバリフレームワークを提案する。
私たちのHoDTは、冗長なフレームのポーズトークンのプルーニングから始まり、フル長のトークンを復元することで終了します。
提案手法は,従来のVPTモデルと比較して高い効率性と推定精度を両立させることができる。
論文 参考訳(メタデータ) (2023-11-20T18:59:51Z) - DGSD: Dynamical Graph Self-Distillation for EEG-Based Auditory Spatial
Attention Detection [49.196182908826565]
AAD(Auditory Attention Detection)は、マルチスピーカー環境で脳信号からターゲット話者を検出することを目的としている。
現在のアプローチは主に、画像のようなユークリッドデータを処理するために設計された従来の畳み込みニューラルネットワークに依存している。
本稿では、入力として音声刺激を必要としないAADのための動的グラフ自己蒸留(DGSD)手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T13:43:46Z) - Multi-Tier Platform for Cognizing Massive Electroencephalogram [6.100405014798822]
エンド・ツー・エンドのプラットフォームは、脳の活動の正確な認識のために構築されている。
スパイキングニューラルネットワーク(SNN)ベースの層は、稀な特徴からスパイクストリームの観点から原理情報を抽出するように設計されている。
提案したティア3は、SNNからスパイクパターンの時間領域と空間領域を変換し、変換されたパターン行列を人工ニューラルネットワーク(ANN, Transformer特に)に供給する。
論文 参考訳(メタデータ) (2022-04-21T01:27:58Z) - TransVOD: End-to-end Video Object Detection with Spatial-Temporal
Transformers [96.981282736404]
時空間トランスフォーマアーキテクチャに基づく最初のエンドツーエンドビデオオブジェクト検出システムであるTransVODを提案する。
提案した TransVOD++ は,90.0% mAP の ImageNet VID の精度で,最先端のレコードを新たに設定する。
提案したTransVOD Liteは,約30FPSで動作する場合に,83.7%のmAPで最高の速度と精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-01-13T16:17:34Z) - Transformer-based Spatial-Temporal Feature Learning for EEG Decoding [4.8276709243429]
本稿では,主に注意機構に依存する新しい脳波復号法を提案する。
我々はより少ないパラメータで、脳波の多分類化における最先端のレベルに達しました。
脳-コンピュータインタフェース(BCI)の実用性を促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2021-06-11T00:48:18Z) - Robust learning from corrupted EEG with dynamic spatial filtering [68.82260713085522]
実験室の外で記録されたEEGを使用して機械学習モデルを構築するには、ノイズの多いデータとランダムに欠落するチャネルにロバストな方法が必要である。
ニューラルネットワークの第1層の前に挿入可能なマルチヘッドアテンションモジュールである動的空間フィルタリング(DSF)を提案する。
筆者らは, チャネル汚損を模擬した4000件の録音を含む公開脳波データと, 自然汚損をともなう移動脳波の自家記録100件のプライベートデータセットを用いて, DSFを試験した。
論文 参考訳(メタデータ) (2021-05-27T02:33:16Z) - EEG-Inception: An Accurate and Robust End-to-End Neural Network for
EEG-based Motor Imagery Classification [123.93460670568554]
本稿では,脳波に基づく運動画像(MI)分類のための新しい畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
提案したCNNモデル、すなわちEEG-Inceptionは、Inception-Timeネットワークのバックボーン上に構築されている。
提案するネットワークは、生のEEG信号を入力とし、複雑なEEG信号前処理を必要としないため、エンドツーエンドの分類である。
論文 参考訳(メタデータ) (2021-01-24T19:03:10Z) - Convolutional Neural Networks for Automatic Detection of Artifacts from
Independent Components Represented in Scalp Topographies of EEG Signals [9.088303226909279]
眼球運動や点滅、筋/心臓活動、一般的な電気障害などによるアーチファクトの認識と排除が求められている。
ICAは、2Dの頭皮のトポグラフィー(画像)に再投影することで、人工物とUBSを認識・分離できる独立したコンポーネント(IC)に信号を切り分けるのに効果的である。
2次元畳み込みニューラルネットワーク(CNN)に基づくICトポロによる脳波アーチファクト認識のための,完全自動かつ効果的なフレームワークを提案する。
実験では、32のトポロを分類するために標準PCで1.4秒を使用、全体の98%以上の精度を示した。
論文 参考訳(メタデータ) (2020-09-08T12:40:10Z) - End-to-End Multi-speaker Speech Recognition with Transformer [88.22355110349933]
音声認識モデルにおけるRNNベースのエンコーダデコーダをトランスフォーマーアーキテクチャに置き換える。
また、計算量を削減するために、シーケンス全体ではなくセグメントに制限されるセルフアテンションコンポーネントを変更します。
論文 参考訳(メタデータ) (2020-02-10T16:29:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。