論文の概要: The "Sound of Silence" in EEG -- Cognitive voice activity detection
- arxiv url: http://arxiv.org/abs/2010.05497v1
- Date: Mon, 12 Oct 2020 07:47:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 08:20:29.553531
- Title: The "Sound of Silence" in EEG -- Cognitive voice activity detection
- Title(参考訳): 脳波における「沈黙の音」 --認知的音声活動検出-
- Authors: Rini A Sharon, Hema A Murthy
- Abstract要約: 音声の沈黙領域に対応する脳活動の「非音声(NS)」状態について検討した。
音声知覚はそのような状態の存在を検査するために研究され、その後、音声の想像力においてその識別が行われる。
認識性能と視覚的区別は脳波におけるサイレントシグネチャの存在を示す。
- 参考スコア(独自算出の注目度): 22.196642357767338
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech cognition bears potential application as a brain computer interface
that can improve the quality of life for the otherwise communication impaired
people. While speech and resting state EEG are popularly studied, here we
attempt to explore a "non-speech"(NS) state of brain activity corresponding to
the silence regions of speech audio. Firstly, speech perception is studied to
inspect the existence of such a state, followed by its identification in speech
imagination. Analogous to how voice activity detection is employed to enhance
the performance of speech recognition, the EEG state activity detection
protocol implemented here is applied to boost the confidence of imagined speech
EEG decoding. Classification of speech and NS state is done using two datasets
collected from laboratory-based and commercial-based devices. The state
sequential information thus obtained is further utilized to reduce the search
space of imagined EEG unit recognition. Temporal signal structures and
topographic maps of NS states are visualized across subjects and sessions. The
recognition performance and the visual distinction observed demonstrates the
existence of silence signatures in EEG.
- Abstract(参考訳): 音声認知は、他のコミュニケーションに障害のある人々の生活の質を向上させる脳コンピューターインタフェースとして応用される可能性がある。
音声と安静状態脳波は一般に研究されているが,本研究では音声の沈黙領域に対応する脳活動の「非音声(NS)」状態を探究する。
まず、そのような状態の存在を検査するために、音声認識の研究を行い、続いて、音声の想像力の同定を行う。
音声認識の性能向上に音声活動検出を用いる方法と類似して,ここで実装した脳波状態行動検出プロトコルを適用し,脳波復号の信頼性を高める。
音声とns状態の分類は、実験室および商用デバイスから収集された2つのデータセットを用いて行われる。
また、得られた状態シーケンシャル情報を利用して、想像された脳波単位認識の検索スペースを削減する。
NS状態の時間信号構造と地形図は、被験者とセッション間で可視化される。
認識性能と視覚的区別は脳波におけるサイレントシグネチャの存在を示す。
関連論文リスト
- Continuous Modeling of the Denoising Process for Speech Enhancement
Based on Deep Learning [61.787485727134424]
状態変数をデノナイジングプロセスを示すために使用します。
UNetのようなニューラルネットワークは、連続的復調プロセスからサンプリングされたすべての状態変数を推定することを学ぶ。
実験結果から, クリーンターゲットに少量の雑音を保存することは, 音声強調に有効であることが示唆された。
論文 参考訳(メタデータ) (2023-09-17T13:27:11Z) - Inner speech recognition through electroencephalographic signals [2.578242050187029]
本研究は、脳波信号から始まる内的音声認識に焦点を当てる。
脳波のテキストへの復号は、限られた数の単語(コマンド)の分類として理解されるべきである。
音声関連BCIは、脳信号からの音声コマンドを通してデバイスを制御する効果的な音声通信戦略を提供する。
論文 参考訳(メタデータ) (2022-10-11T08:29:12Z) - Direction-Aware Joint Adaptation of Neural Speech Enhancement and
Recognition in Real Multiparty Conversational Environments [21.493664174262737]
本稿では,現実の多人数会話環境における音声コミュニケーションを支援する拡張現実ヘッドセットの雑音音声認識について述べる。
本研究では,高信頼な推定文字を用いたクリーン音声信号とノイズ音声信号を用いて,マスク推定器とASRモデルを実行時に共同で更新する半教師付き適応手法を提案する。
論文 参考訳(メタデータ) (2022-07-15T03:43:35Z) - Audio-Visual Speech Codecs: Rethinking Audio-Visual Speech Enhancement
by Re-Synthesis [67.73554826428762]
本稿では,AR/VRにおける高忠実度通信のための新しい音声・視覚音声強調フレームワークを提案する。
提案手法は音声・視覚音声の手がかりを利用してニューラル音声のコードを生成することで,ノイズ信号からクリーンでリアルな音声を効率的に合成する。
論文 参考訳(メタデータ) (2022-03-31T17:57:10Z) - Learning Audio-Visual Dereverberation [87.52880019747435]
環境中の表面や物体を反射する音声からの残響は、人間の知覚の質を低下させるだけでなく、自動音声認識の精度にも深刻な影響を及ぼす。
我々の考えは、音声・視覚的観察から音声を除去することである。
そこで我々は,観測音と映像シーンの両方に基づいて残響を除去することを学ぶエンドツーエンドアプローチである,視覚インフォームド・デバーベレーション・オブ・オーディオ(VIDA)を紹介した。
論文 参考訳(メタデータ) (2021-06-14T20:01:24Z) - Brain Signals to Rescue Aphasia, Apraxia and Dysarthria Speech
Recognition [14.544989316741091]
本稿では,失語症,失語症,構音障害に対する自動音声認識システムの性能を向上させるための深層学習に基づくアルゴリズムを提案する。
分離音声認識タスクにおいて,テスト時間中のデコード性能が50%以上向上することを示す。
その結果, 失語症, 失語症, 構音障害から回復した脳卒中患者の実時間ロバスト音声補綴物の設計に非侵襲的神経信号を利用する可能性を示す第一歩が示された。
論文 参考訳(メタデータ) (2021-02-28T03:27:02Z) - Speech Enhancement for Wake-Up-Word detection in Voice Assistants [60.103753056973815]
キースポッティング、特にWake-Up-Word(WUW)検出は音声アシスタントにとって非常に重要なタスクである。
本稿では,WUW検出に適応した音声強調モデルを提案する。
これらのノイズの存在下で、認識率を高め、誤報を減らすことを目的としている。
論文 参考訳(メタデータ) (2021-01-29T18:44:05Z) - Silent Speech Interfaces for Speech Restoration: A Review [59.68902463890532]
サイレント音声インタフェース (SSI) の研究は、重度音声障害の患者に対して、代替的で拡張的なコミュニケーション方法を提供することを目的としている。
SSIは、コミュニケーションを可能にするために、音声生成中に人体によって生成される非音響バイオシグナーに依存している。
現在、ほとんどのSSIは、健康なユーザーのために実験室でのみ検証されている。
論文 参考訳(メタデータ) (2020-09-04T11:05:50Z) - Understanding effect of speech perception in EEG based speech
recognition systems [3.5786621294068377]
音声と平行に記録された脳波信号を用いて、孤立的かつ連続的な音声認識を行う。
我々は、より堅牢な脳波に基づく音声認識システムを設計するために、この音声認識成分を脳波信号から切り離すことが可能かどうかを検討する。
論文 参考訳(メタデータ) (2020-05-29T05:56:09Z) - Continuous Silent Speech Recognition using EEG [3.5786621294068377]
我々は、被験者がテキストに音声を起こさずに、頭の中で英語の文章を読んでいる間に、平行に記録された脳波信号を翻訳する。
脳波信号を用いた連続無声音声認識の実現可能性を示した。
論文 参考訳(メタデータ) (2020-02-06T18:28:45Z) - Visually Guided Self Supervised Learning of Speech Representations [62.23736312957182]
音声視覚音声の文脈における視覚的モダリティによって導かれる音声表現を学習するためのフレームワークを提案する。
音声クリップに対応する静止画像をアニメーション化し、音声セグメントの実際の映像にできるだけ近いよう、生成した映像を最適化する。
我々は,感情認識のための技術成果と,音声認識のための競争結果を達成する。
論文 参考訳(メタデータ) (2020-01-13T14:53:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。