論文の概要: Speech Artifact Removal from EEG Recordings of Spoken Word Production
with Tensor Decomposition
- arxiv url: http://arxiv.org/abs/2206.00635v1
- Date: Wed, 1 Jun 2022 17:10:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-02 13:52:20.164635
- Title: Speech Artifact Removal from EEG Recordings of Spoken Word Production
with Tensor Decomposition
- Title(参考訳): テンソル分解による音声生成の脳波記録からの音声アーチファクト除去
- Authors: Holy Lovenia, Hiroki Tanaka, Sakriani Sakti, Ayu Purwarianti, and
Satoshi Nakamura
- Abstract要約: 音声アーティファクトは脳波(EEG)信号を汚染し、基礎となる認知過程の検査を防ぐ。
音声による脳波研究をさらに促進するため,3モードテンソル分解法を提案する。
画像認識タスクでは, 口に2つの電極を配置し, 口唇筋電図を記録することで, 音声のアーティファクトを用いて生データを収集した。
- 参考スコア(独自算出の注目度): 20.397149635457346
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Research about brain activities involving spoken word production is
considerably underdeveloped because of the undiscovered characteristics of
speech artifacts, which contaminate electroencephalogram (EEG) signals and
prevent the inspection of the underlying cognitive processes. To fuel further
EEG research with speech production, a method using three-mode tensor
decomposition (time x space x frequency) is proposed to perform speech artifact
removal. Tensor decomposition enables simultaneous inspection of multiple
modes, which suits the multi-way nature of EEG data. In a picture-naming task,
we collected raw data with speech artifacts by placing two electrodes near the
mouth to record lip EMG. Based on our evaluation, which calculated the
correlation values between grand-averaged speech artifacts and the lip EMG,
tensor decomposition outperformed the former methods that were based on
independent component analysis (ICA) and blind source separation (BSS), both in
detecting speech artifact (0.985) and producing clean data (0.101). Our
proposed method correctly preserved the components unrelated to speech, which
was validated by computing the correlation value between the grand-averaged raw
data without EOG and cleaned data before the speech onset (0.92-0.94).
- Abstract(参考訳): 脳波(EEG)シグナルを汚染し、基礎となる認知過程の検査を阻害する、音声アーチファクトの未発見特性のため、発声語生成に関わる脳活動の研究は、かなり未発達である。
音声生成による脳波研究を促進させるために, 3モードテンソル分解(時間x空間x周波数)を用いた音声アーティファクト除去法を提案する。
テンソル分解は脳波データのマルチウェイ特性に適合する複数のモードの同時検査を可能にする。
画像解析タスクでは,唇筋電図を記録するために2つの電極を口の近くに置き,音声アーチファクトを用いた生データを収集した。
評価の結果,大平均音声アーティファクトと唇筋電図の相関値を算出し,独立成分分析(ICA)とブラインドソース分離(BSS)に基づく従来手法よりも高い性能を示し,音声アーティファクトの検出(0.985)とクリーンデータの生成(0.101)が得られた。
提案手法は,EOGのない大容量生データと音声開始前のクリーン化データとの相関値を計算し,音声と無関係な成分を正しく保存する(0.92-0.94)。
関連論文リスト
- Enhancing Electrocardiogram Signal Analysis Using NLP-Inspired Techniques: A Novel Approach with Embedding and Self-Attention [2.7651063843287718]
埋め込みと自己注意に基づく新しい心電図解析手法を提案し,心電図データの空間的および時間的依存性を捉える。
91%の精度でF1スコアが得られた。
論文 参考訳(メタデータ) (2024-07-15T12:20:15Z) - HyPoradise: An Open Baseline for Generative Speech Recognition with
Large Language Models [81.56455625624041]
ASRの誤り訂正に外部の大規模言語モデル(LLM)を利用する最初のオープンソースベンチマークを導入する。
提案したベンチマークには、334,000組以上のN-best仮説を含む新しいデータセットHyPoradise (HP)が含まれている。
合理的なプロンプトと生成能力を持つLLMは、N-bestリストに欠けているトークンを修正できる。
論文 参考訳(メタデータ) (2023-09-27T14:44:10Z) - EOG Artifact Removal from Single and Multi-channel EEG Recordings
through the combination of Long Short-Term Memory Networks and Independent
Component Analysis [0.0]
脳波信号からのEOGアーチファクト除去の課題に対処するために,LSTM(Long Short-term memory)ベースのニューラルネットワークとICAを組み合わせた新しい手法を提案する。
本研究の目的は,1) 汚染された脳波データから水平および垂直EOG信号を推定し,2) ICAを用いて脳波から推定EOG信号を除去することである。
論文 参考訳(メタデータ) (2023-08-25T13:32:28Z) - A New Benchmark of Aphasia Speech Recognition and Detection Based on
E-Branchformer and Multi-task Learning [29.916793641951507]
本稿では,最新の音声認識技術を用いた失語症音声認識のための新しいベンチマークを提案する。
CTC/Attentionアーキテクチャに基づく2つのマルチタスク学習手法を導入し、両方のタスクを同時に実行する。
当システムでは,中等度失語症患者に対して,最先端の話者レベル検出精度(97.3%)と相対的なWER低下率(1%)を達成している。
論文 参考訳(メタデータ) (2023-05-19T15:10:36Z) - Removal of Ocular Artifacts in EEG Using Deep Learning [0.0]
眼アーチファクトの除去はこれらのアーティファクトの中でも最も困難である。
本研究では,双方向長短記憶(BiLSTM)に基づく深層学習(DL)モデルを開発することにより,新しい眼内人工物除去法を提案する。
この結果から,WSST-Netモデルは従来のTF法や生信号法と比較して,アーティファクト除去性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2022-09-24T11:19:52Z) - Unsupervised Anomaly Detection in 3D Brain MRI using Deep Learning with
impured training data [53.122045119395594]
トレーニングデータ中の不健康なサンプルが脳MRIスキャンの異常検出性能に与える影響について検討した。
AEの再構成誤差に基づいて,トレーニング中に誤ラベル付きサンプルを直接識別する手法の評価を行った。
論文 参考訳(メタデータ) (2022-04-12T13:05:18Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Discretization and Re-synthesis: an alternative method to solve the
Cocktail Party Problem [65.25725367771075]
この研究は、初めて合成に基づくアプローチがこの問題にうまく対応できることを示した。
具体的には,離散シンボルの認識に基づく音声分離/強調モデルを提案する。
離散シンボルの入力による合成モデルを利用することで、離散シンボル列の予測後、各ターゲット音声を再合成することができる。
論文 参考訳(メタデータ) (2021-12-17T08:35:40Z) - Adaptive Multi-View ICA: Estimation of noise levels for optimal
inference [65.94843987207445]
Adaptive MultiView ICA (AVICA) はノイズの多いICAモデルであり、各ビューは共有された独立したソースと付加的なノイズの線形混合である。
AVICAは、その明示的なMMSE推定器により、他のICA法よりも優れたソース推定値が得られる。
実脳磁図(MEG)データでは,分解がサンプリングノイズに対する感度が低く,ノイズ分散推定が生物学的に妥当であることを示す。
論文 参考訳(メタデータ) (2021-02-22T13:10:12Z) - Multi-Modal Detection of Alzheimer's Disease from Speech and Text [3.702631194466718]
本稿では,アルツハイマー病(AD)の診断に音声と対応する文字を同時に利用する深層学習手法を提案する。
提案手法は,Dementiabank Pitt corpus のトレーニングおよび評価において,85.3%のクロスバリデーション精度を実現する。
論文 参考訳(メタデータ) (2020-11-30T21:18:17Z) - Continuous Speech Separation with Conformer [60.938212082732775]
分離システムでは、リカレントニューラルネットワークの代わりにトランスとコンバータを用いる。
我々は,自己注意に基づく方法でグローバルな情報を取得することが,音声分離に不可欠であると信じている。
論文 参考訳(メタデータ) (2020-08-13T09:36:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。