論文の概要: Reconstructing Unseen Sentences from Speech-related Biosignals for Open-vocabulary Neural Communication
- arxiv url: http://arxiv.org/abs/2510.27247v1
- Date: Fri, 31 Oct 2025 07:31:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:16.020514
- Title: Reconstructing Unseen Sentences from Speech-related Biosignals for Open-vocabulary Neural Communication
- Title(参考訳): オープンボキャブラリニューラル通信のための音声関連生体信号からの未知文の再構成
- Authors: Deok-Seon Kim, Seo-Hyun Lee, Kang Yin, Seong-Whan Lee,
- Abstract要約: 本研究は,様々な音声モードにおける未確認文に対する音声合成の可能性について検討する。
本研究では,高密度脳波(EEG)信号から抽出した音素レベル情報と筋電図(EMG)信号とを独立に利用した。
本研究は, 生体信号に基づく文レベルの音声合成が未確認文の再構成に有効であることを示すものである。
- 参考スコア(独自算出の注目度): 45.424817836500175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Brain-to-speech (BTS) systems represent a groundbreaking approach to human communication by enabling the direct transformation of neural activity into linguistic expressions. While recent non-invasive BTS studies have largely focused on decoding predefined words or sentences, achieving open-vocabulary neural communication comparable to natural human interaction requires decoding unconstrained speech. Additionally, effectively integrating diverse signals derived from speech is crucial for developing personalized and adaptive neural communication and rehabilitation solutions for patients. This study investigates the potential of speech synthesis for previously unseen sentences across various speech modes by leveraging phoneme-level information extracted from high-density electroencephalography (EEG) signals, both independently and in conjunction with electromyography (EMG) signals. Furthermore, we examine the properties affecting phoneme decoding accuracy during sentence reconstruction and offer neurophysiological insights to further enhance EEG decoding for more effective neural communication solutions. Our findings underscore the feasibility of biosignal-based sentence-level speech synthesis for reconstructing unseen sentences, highlighting a significant step toward developing open-vocabulary neural communication systems adapted to diverse patient needs and conditions. Additionally, this study provides meaningful insights into the development of communication and rehabilitation solutions utilizing EEG-based decoding technologies.
- Abstract(参考訳): 脳音声システム(BTS)は、神経活動の言語表現への直接変換を可能にすることによって、人間のコミュニケーションに対する画期的なアプローチである。
近年の非侵襲的BTS研究は、定義済みの単語や文の復号化に重点を置いているが、自然言語に匹敵するオープンボキャブラリニューラルなコミュニケーションを実現するには、制約のない音声の復号が必要である。
さらに、患者に対するパーソナライズされた適応型ニューラルコミュニケーションとリハビリテーションソリューションを開発するためには、音声からの多様な信号を効果的に統合することが不可欠である。
本研究では,高密度脳波 (EEG) 信号から抽出した音素レベル情報と筋電図 (EMG) 信号とを独立に利用し, 様々な音声モードにまたがる未確認文の音声合成の可能性について検討した。
さらに, 文再構成時の音素復号精度に影響を及ぼす特性について検討し, 脳波復号法をより効果的にするための神経生理学的知見を提供する。
本研究は, 生体信号に基づく文レベルの音声合成による未確認文の再構築の可能性を強調し, 多様な患者のニーズや状況に適応したオープン語彙型ニューラルコミュニケーションシステムの開発に向けた重要な一歩であることを示すものである。
さらに,脳波を用いた復号化技術を活用したコミュニケーション・リカバリソリューションの開発について,有意義な知見を提供する。
関連論文リスト
- WaveMind: Towards a Conversational EEG Foundation Model Aligned to Textual and Visual Modalities [55.00677513249723]
脳波信号は認知過程と固有の神経状態の両方を同時に符号化する。
我々は、EEG信号とその対応するモダリティを統一意味空間にマッピングし、一般化された解釈を実現する。
結果として得られたモデルは、柔軟でオープンな会話をサポートしながら、堅牢な分類精度を示す。
論文 参考訳(メタデータ) (2025-09-26T06:21:51Z) - Bridging Brain Signals and Language: A Deep Learning Approach to EEG-to-Text Decoding [1.1655046053160683]
本稿では,従来の閉語彙EEG-to-textデコードアプローチを変更する特殊なフレームワークを提案する。
本研究の目的は,オープン語彙テキスト生成システムと人間の脳信号の解釈を関連付けることである。
論文 参考訳(メタデータ) (2025-02-11T14:43:14Z) - Towards Dynamic Neural Communication and Speech Neuroprosthesis Based on Viseme Decoding [25.555303640695577]
テキスト、音声、あるいは人間の神経信号から画像を復号することは、患者の神経補綴や革新的なコミュニケーションツールとして有望な可能性を秘めている。
音声関連非侵襲脳信号から視覚音声意図を復号する拡散モデルに基づくフレームワークを開発した。
脳信号と動的視覚インターフェースのギャップを効果的に埋め、コヒーレントな唇運動の再構築に成功した。
論文 参考訳(メタデータ) (2025-01-09T04:47:27Z) - Geometry of orofacial neuromuscular signals: speech articulation decoding using surface electromyography [0.0]
表面筋電図(EMG)信号を用いた音声明瞭化のためのデータと方法を提案する。
EMGベースの音声ニューロプロテーゼは、知的に話す能力を失った個人において、可聴音声の復元に有望なアプローチを提供する。
論文 参考訳(メタデータ) (2024-11-04T20:31:22Z) - Neural Speech Embeddings for Speech Synthesis Based on Deep Generative
Networks [27.64740032872726]
脳信号から音声合成が可能な脳音声合成技術について紹介する。
また, 音声処理中に神経生理学的活性化の基盤となる神経特徴と音声の埋め込みを包括的に分析した。
論文 参考訳(メタデータ) (2023-12-10T08:12:08Z) - Language Generation from Brain Recordings [68.97414452707103]
本稿では,大言語モデルと意味脳デコーダの容量を利用した生成言語BCIを提案する。
提案モデルでは,視覚的・聴覚的言語刺激のセマンティック内容に整合したコヒーレントな言語系列を生成することができる。
本研究は,直接言語生成におけるBCIの活用の可能性と可能性を示すものである。
論文 参考訳(メタデータ) (2023-11-16T13:37:21Z) - Open Vocabulary Electroencephalography-To-Text Decoding and Zero-shot
Sentiment Classification [78.120927891455]
最先端のブレイン・トゥ・テキストシステムは、ニューラルネットワークを使用して脳信号から直接言語を復号することに成功した。
本稿では,自然読解課題における語彙的脳波(EEG)-テキスト列列列復号化とゼロショット文感性分類に問題を拡張する。
脳波-テキストデコーディングで40.1%のBLEU-1スコア、ゼロショット脳波に基づく3次感情分類で55.6%のF1スコアを達成し、教師付きベースラインを著しく上回る結果となった。
論文 参考訳(メタデータ) (2021-12-05T21:57:22Z) - Silent Speech Interfaces for Speech Restoration: A Review [59.68902463890532]
サイレント音声インタフェース (SSI) の研究は、重度音声障害の患者に対して、代替的で拡張的なコミュニケーション方法を提供することを目的としている。
SSIは、コミュニケーションを可能にするために、音声生成中に人体によって生成される非音響バイオシグナーに依存している。
現在、ほとんどのSSIは、健康なユーザーのために実験室でのみ検証されている。
論文 参考訳(メタデータ) (2020-09-04T11:05:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。