論文の概要: End-to-End Intracortical Speech Decoding from Neural Activity
- arxiv url: http://arxiv.org/abs/2605.24313v1
- Date: Sat, 23 May 2026 00:39:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.926797
- Title: End-to-End Intracortical Speech Decoding from Neural Activity
- Title(参考訳): 神経活動からのエンド・ツー・エンド皮質内音声復号
- Authors: Owais Mujtaba Khanday, Jose A. Gonzalez-Lopez, Marc Ouellet, Alberto Galdon, Gonzalo Olivares Granados,
- Abstract要約: そこで本研究では,ALSの参加者の皮質内記録を直接トレーニングした,エンドツーエンドのコンフォーマーベースのニューラルデコーダを提案する。
外部言語モデルがなければ、システムは保持されたバリデーションデータに対して23.80%の文字誤り率(CER)を達成する。
- 参考スコア(独自算出の注目度): 0.8209843760716958
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current high-performing intracortical speech neuroprostheses achieve low word error rates but typically rely on external language models during inference, increasing memory, computation, and latency. In this work, we investigate whether meaningful character-level decoding is achievable without such models. We propose an end-to-end Conformer-based neural decoder trained directly on intracortical recordings from a participant with amyotrophic lateral sclerosis (ALS). Without any external language model, the system achieves a character error rate (CER) of 23.80\% on held-out validation data. Analysis shows that performance variability is driven by inter-session signal degradation, while dominant errors arise from incorrect word boundary segmentation. These results demonstrate that effective character-level decoding is possible in a fully end-to-end framework, providing a strong neural signal for downstream linguistic processing.
- Abstract(参考訳): 現在の高パフォーマンスの皮質内音声ニューロプロセシスは低い単語誤り率を達成するが、一般的には推論、メモリ、計算、レイテンシの増大など、外部言語モデルに依存している。
本研究では,そのようなモデルなしで有意義な文字レベルの復号化が可能かどうかを検討する。
筋萎縮性側索硬化症(ALS)患者の皮質内記録を直接訓練したエンド・ツー・エンドコンフォーマーベースのニューラルデコーダを提案する。
外部言語モデルがなければ、システムは保持されたバリデーションデータに対して23.80\%の文字誤り率(CER)を達成する。
分析の結果,不正確な単語境界セグメンテーションから有意な誤りが発生する一方で,セッション間信号の劣化によって性能の変動が引き起こされることがわかった。
これらの結果は、下流言語処理のための強力なニューラルネットワークを提供する完全エンドツーエンドのフレームワークにおいて、効果的な文字レベルの復号化が可能であることを証明している。
関連論文リスト
- ALIGN: Adversarial Learning for Generalizable Speech Neuroprosthesis [8.585361192120576]
皮質内脳-コンピュータインターフェース(BCI)は、録音セッション間でプールされたデータに基づいてトレーニングされた場合、神経活動から音声を高精度に復号することができる。
半教師付きクロスセッション適応のためのマルチドメイン逆ニューラルネットワークに基づくセッション不変学習フレームワークであるALIGNを提案する。
論文 参考訳(メタデータ) (2026-03-18T21:38:00Z) - Decoding the decoder: Contextual sequence-to-sequence modeling for intracortical speech decoding [0.0]
音声脳-コンピュータインタフェースは、皮質内活動から言語出力に変換するデコーダを必要とする。
文脈的シーケンス・ツー・シーケンスの復号化がサブレキシカル・ニューラル・リードアウト、ロバストネス、解釈可能性にどのような影響を及ぼすかはいまだ不明である。
我々は,6v領域の皮質内記録からの音声復号を試みるためのトランスフォーマーに基づくシーケンス・ツー・シーケンス・モデルの評価を行った。
論文 参考訳(メタデータ) (2026-03-10T11:46:14Z) - DeepSpeech models show Human-like Performance and Processing of Cochlear Implant Inputs [12.234206036041218]
我々は、ディープニューラルネットワーク(DNN)のDeepSpeech2をパラダイムとして、自然入力と人工内耳ベースの入力が時間の経過とともにどのように処理されるかを調べる。
音声文から自然言語および人工内耳のような入力を生成し、モデル性能と人的性能の類似性を検証した。
各レイヤにおける時間的ダイナミクスは、コンテキストや入力タイプの影響を受けます。
論文 参考訳(メタデータ) (2024-07-30T04:32:27Z) - Towards Faster k-Nearest-Neighbor Machine Translation [51.866464707284635]
k-nearest-neighbor 機械翻訳アプローチは、トークンをデコードする際に、データストア全体の重い検索オーバーヘッドに悩まされる。
ニューラルネットワークの翻訳モデルとkNNが生成する確率によってトークンが共同で翻訳されるべきかどうかを予測するための,単純で効果的な多層パーセプトロン(MLP)ネットワークを提案する。
本手法は,翻訳品質をわずかに低下させることなく,kNN検索のオーバーヘッドを最大53%削減する。
論文 参考訳(メタデータ) (2023-12-12T16:41:29Z) - Deep Learning for real-time neural decoding of grasp [0.0]
本稿では,ニューラルネットワークの復号化のためのDeep Learningに基づく手法を提案する。
提案手法の主な目的は、これまでの神経科学知識に頼ることなく、最先端の復号精度を改善することである。
論文 参考訳(メタデータ) (2023-11-02T08:26:29Z) - HyPoradise: An Open Baseline for Generative Speech Recognition with
Large Language Models [81.56455625624041]
ASRの誤り訂正に外部の大規模言語モデル(LLM)を利用する最初のオープンソースベンチマークを導入する。
提案したベンチマークには、334,000組以上のN-best仮説を含む新しいデータセットHyPoradise (HP)が含まれている。
合理的なプロンプトと生成能力を持つLLMは、N-bestリストに欠けているトークンを修正できる。
論文 参考訳(メタデータ) (2023-09-27T14:44:10Z) - Decoding speech perception from non-invasive brain recordings [48.46819575538446]
非侵襲的な記録から知覚音声の自己教師付き表現をデコードするために、コントラスト学習で訓練されたモデルを導入する。
我々のモデルでは、3秒のMEG信号から、1,000以上の異なる可能性から最大41%の精度で対応する音声セグメントを識別できる。
論文 参考訳(メタデータ) (2022-08-25T10:01:43Z) - Understanding Model Robustness to User-generated Noisy Texts [2.958690090551675]
NLPでは、スペルエラーなどの自然発生ノイズによってモデル性能が劣化することが多い。
本稿では,文法的誤り訂正コーパスから統計的に誤りをモデル化する。
論文 参考訳(メタデータ) (2021-10-14T14:54:52Z) - On Long-Tailed Phenomena in Neural Machine Translation [50.65273145888896]
最先端のニューラルネットワーク翻訳(NMT)モデルは、低周波トークンの生成に苦労する。
条件付きテキスト生成における構造的依存関係にモデルトレーニングを適応させるために,新たな損失関数である反焦点損失を提案する。
提案手法は,複数の機械翻訳(MT)データセットに対して有効であり,クロスエントロピーよりも顕著に向上することを示す。
論文 参考訳(メタデータ) (2020-10-10T07:00:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。