論文の概要: Toward Robust EEG-based Intention Decoding during Misarticulated Speech in Aphasia
- arxiv url: http://arxiv.org/abs/2511.07895v1
- Date: Wed, 12 Nov 2025 01:26:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.529156
- Title: Toward Robust EEG-based Intention Decoding during Misarticulated Speech in Aphasia
- Title(参考訳): 失語症音声におけるロバスト脳波を用いた意図復号化に向けて
- Authors: Ha-Na Jo, Jung-Sun Lee, Eunyeong Ko,
- Abstract要約: 失語症は言語生産の障害により言語コミュニケーションを厳しく制限し、しばしばスピーチの試行中に頻繁に誤聴を引き起こす。
脳-コンピュータインタフェース技術への関心が高まりつつあるにもかかわらず、失語症患者に適した脳波ベースのコミュニケーション支援システムの開発には、比較的注意が払われていない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aphasia severely limits verbal communication due to impaired language production, often leading to frequent misarticulations during speech attempts. Despite growing interest in brain-computer interface technologies, relatively little attention has been paid to developing EEG-based communication support systems tailored for aphasic patients. To address this gap, we recruited a single participant with expressive aphasia and conducted an Korean-based automatic speech task. EEG signals were recorded during task performance, and each trial was labeled as either correct or incorrect depending on whether the intended word was successfully spoken. Spectral analysis revealed distinct neural activation patterns between the two trial types: misarticulated trials exhibited excessive delta power across widespread channels and increased theta-alpha activity in frontal regions. Building upon these findings, we developed a soft multitask learning framework with maximum mean discrepancy regularization that focus on delta features to jointly optimize class discrimination while aligning the EEG feature distributions of correct and misarticulated trials. The proposed model achieved 58.6 % accuracy for correct and 45.5 % for misarticulated trials-outperforming the baseline by over 45 % on the latter-demonstrating robust intention decoding even under articulation errors. These results highlight the feasibility of EEG-based assistive systems capable of supporting real-world, imperfect speech conditions in aphasia patients.
- Abstract(参考訳): 失語症は言語生産の障害により言語コミュニケーションを厳しく制限し、しばしばスピーチの試行中に頻繁に誤聴を引き起こす。
脳-コンピュータインタフェース技術への関心が高まりつつあるにもかかわらず、失語症患者に適した脳波ベースのコミュニケーション支援システムの開発には、比較的注意が払われていない。
このギャップに対処するため,我々は,表現的失語症のあるひとりの参加者を募集し,韓国語による音声自動処理を行った。
脳波信号はタスク実行中に記録され、各試行は意図した単語が正常に話されるかどうかによって正しいか間違っているとラベル付けされた。
スペクトル分析により,前頭葉領域におけるデルタパワーの過大な増加と,前頭葉領域におけるセタアルファ活性の増大,の2つの試験種間での神経活性化パターンが明らかとなった。
これらの知見に基づいて, デルタ特徴に着目し, 脳波の特徴分布を整合させ, クラス識別を協調的に最適化する, 平均差分数正則化を最大化するソフトマルチタスク学習フレームワークを開発した。
提案モデルの精度は58.6 %, 誤調試験では45.5 %, 構音誤り下でも45 %以上向上した。
これらの結果は,失語症患者の現実的,不完全な発話を支援できる脳波ベースの補助システムの実現可能性を強調した。
関連論文リスト
- Lightweight Diffusion-based Framework for Online Imagined Speech Decoding in Aphasia [1.299941371793082]
拡散に基づくニューラルデコーディングフレームワークは、失語症患者のリアルタイムな仮想音声分類に最適化されている。
二重基準早期停止戦略により、限られたキャリブレーションデータの下での迅速な収束が可能となった。
提案するフレームワークは,脳-コンピュータインタフェースを臨床コミュニケーション支援に向けて翻訳する。
論文 参考訳(メタデータ) (2025-11-11T07:18:35Z) - Wearable intelligent throat enables natural speech in stroke patients with dysarthria [18.380855184550775]
ウェアラブル型サイレント音声システムは, 音声障害患者のコミュニケーション回復に有意な可能性を秘めている。
喉の筋肉振動と頸動脈パルス信号センサを統合したAI駆動型インテリジェント喉(IT)システムを提案する。
変形性脳症の脳卒中患者5名を対象に、ITのLLMエージェントはトークンエラーをインテリジェントに修正し、文レベルの感情的および論理的一貫性を充実させた。
論文 参考訳(メタデータ) (2024-11-27T12:03:52Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Recent Progress in the CUHK Dysarthric Speech Recognition System [66.69024814159447]
障害音声は、現在のデータ集約型ディープニューラルネットワーク(DNN)に基づく自動音声認識技術に対して、幅広い課題を提示している。
本稿では,香港の中国大学における音声認識システムの性能向上に向けた最近の研究成果について述べる。
論文 参考訳(メタデータ) (2022-01-15T13:02:40Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Spectro-Temporal Deep Features for Disordered Speech Assessment and
Recognition [65.25325641528701]
音声スペクトルのSVD分解による深い特徴を埋め込んだ新しいスペクトル時空間ベースを提案する。
UASpeechコーパスで行った実験では、提案された分光時間深部特徴適応システムは、データ拡張の有無にかかわらず、ワードエラー率(WER)を最大263%(相対8.6%)削減することで、ベースラインi-適応を一貫して上回ったことが示唆された。
論文 参考訳(メタデータ) (2022-01-14T16:56:43Z) - Brain Signals to Rescue Aphasia, Apraxia and Dysarthria Speech
Recognition [14.544989316741091]
本稿では,失語症,失語症,構音障害に対する自動音声認識システムの性能を向上させるための深層学習に基づくアルゴリズムを提案する。
分離音声認識タスクにおいて,テスト時間中のデコード性能が50%以上向上することを示す。
その結果, 失語症, 失語症, 構音障害から回復した脳卒中患者の実時間ロバスト音声補綴物の設計に非侵襲的神経信号を利用する可能性を示す第一歩が示された。
論文 参考訳(メタデータ) (2021-02-28T03:27:02Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。