論文の概要: Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding
- arxiv url: http://arxiv.org/abs/2603.03312v1
- Date: Mon, 09 Feb 2026 02:47:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:08.140192
- Title: Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding
- Title(参考訳): BLEUトラップのエスケープ:EEG-to-Textデコーディングのための分離されたセマンティックガイダンスを備えた信号グラウンドフレームワーク
- Authors: Yuchen Wang, Haonan Wang, Yu Guo, Honglong Yang, Xiaomeng Li,
- Abstract要約: SemKeyは4つのセマンティックな目的を通じて信号基底生成を強制する新しいフレームワークである。
N-way Retrieval Accuracy と Fréchet Distance を採用することで,標準的な翻訳指標を越えることができる。
- 参考スコア(独自算出の注目度): 41.209385903282374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decoding natural language from non-invasive EEG signals is a promising yet challenging task. However, current state-of-the-art models remain constrained by three fundamental limitations: Semantic Bias (mode collapse into generic templates), Signal Neglect (hallucination based on linguistic priors rather than neural inputs), and the BLEU Trap, where evaluation metrics are artificially inflated by high-frequency stopwords, masking a lack of true semantic fidelity. To address these challenges, we propose SemKey, a novel multi-stage framework that enforces signal-grounded generation through four decoupled semantic objectives: sentiment, topic, length, and surprisal. We redesign the interaction between the neural encoder and the Large Language Model (LLM) by injecting semantic prompts as Queries and EEG embeddings as Key-Value pairs, strictly forcing the model to attend to neural inputs. Furthermore, we move beyond standard translation metrics by adopting N-way Retrieval Accuracy and Fréchet Distance to rigorously assess diversity and alignment. Extensive experiments demonstrate that our approach effectively eliminates hallucinations on noise inputs and achieves SOTA performance on these robust protocols. Code will be released upon acceptance at https://github.com/xmed-lab/SemKey.
- Abstract(参考訳): 非侵襲的な脳波信号から自然言語を復号することは、有望だが挑戦的な課題である。
しかし、現在の最先端モデルは、セマンティックバイアス(一般的なテンプレートへのモード崩壊)、シグナルネグレクト(ニューラル入力よりも言語的な先行性に基づく幻覚)、BLEUトラップ(英語版)の3つの基本的な制限によって制約され、評価指標は高周波の停止語によって人工的に膨らませられ、真の意味的忠実性の欠如を隠蔽する。
これらの課題に対処するために,SemKeyを提案する。SemKeyは4つの分離された意味的目的(感情,話題,長さ,前提)を通じて信号場生成を強制する,新しい多段階フレームワークである。
我々は,ニューラルネットワークとLarge Language Model(LLM)の相互作用を再設計し,クエリとEEGの組込みをキーバリューペアとして意味的プロンプトを注入し,モデルにニューラルネットワークへの参加を強要した。
さらに,N-way Retrieval AccuracyとFréchet Distanceを採用し,多様性とアライメントを厳格に評価することで,標準的な翻訳指標を超越する。
広汎な実験により,本手法は雑音入力に対する幻覚を効果的に排除し,これらの頑健なプロトコル上でのSOTA性能を実現する。
コードはhttps://github.com/xmed-lab/SemKeyで受け入れられる。
関連論文リスト
- Unifying Heterogeneous Multi-Modal Remote Sensing Detection Via Language-Pivoted Pretraining [59.2578488860426]
不均一なマルチモーダルリモートセンシングオブジェクト検出は、多様なセンサからオブジェクトを正確に検出することを目的としている。
既存のアプローチでは、下流の微調整中にモーダリティアライメントとタスク固有の最適化が絡み合う遅延アライメントパラダイムが採用されている。
本稿では,下流のタスク学習からモダリティアライメントを明確に分離する,統一型言語パイロット事前学習フレームワークであるBabelRSを提案する。
論文 参考訳(メタデータ) (2026-03-02T11:38:12Z) - The Compliance Paradox: Semantic-Instruction Decoupling in Automated Academic Code Evaluation [11.984098021215878]
SPACI(Semantic-Preserving Adrial Code Injection)フレームワークとAST-ASIP(Abstract Syntax Tree-Aware Semantic Injection Protocol)を紹介する。
これらの方法は、抽象構文木(英語版)の構文的に不活性な領域(トリヴィアノード)に逆方向の指示を埋め込むことにより、構文解析ギャップを利用する。
Python、C、C++、Javaの25,000のサブミッションにまたがる9つのSOTAモデルの大規模な評価を通じて、DeepSeek-V3のような高容量オープンウェイトモデルにおいて、破滅的な失敗率(>95%)を明らかにします。
論文 参考訳(メタデータ) (2026-01-29T07:40:58Z) - STEAD: Robust Provably Secure Linguistic Steganography with Diffusion Language Model [71.35577462669856]
拡散言語モデル(DLM)を用いた頑健で確実な言語ステガノグラフィーを提案する。
ステガノグラフ抽出中に擬似ランダム誤り訂正や近傍探索補正を含む誤り訂正戦略を導入する。
論文 参考訳(メタデータ) (2026-01-21T08:58:12Z) - Data-Efficient American Sign Language Recognition via Few-Shot Prototypical Networks [0.0]
孤立手話認識は、難聴者と難聴者(DHH)コミュニティと聴覚世界との間のコミュニケーションギャップを埋めるために重要である。
骨格型エンコーダに適応したFew-Shot Prototypeal Networkフレームワークを提案する。
提案手法は,記号が動的クラスプロトタイプに近接して分類される意味的距離空間の学習に,韻律的学習を利用する。
論文 参考訳(メタデータ) (2025-12-11T11:50:03Z) - Hybrid Fuzzing with LLM-Guided Input Mutation and Semantic Feedback [0.0]
本稿では,静的および動的解析をLarge Language Model(LLM)誘導入力変異と意味フィードバックと統合したハイブリッドファジリングフレームワークを提案する。
本手法は,最先端のファジィよりも高速な時間対第一のバグ,意味的多様性の向上,およびユニークなバグの競合数を実現する。
論文 参考訳(メタデータ) (2025-11-06T02:38:24Z) - Autoregressive Speech Synthesis without Vector Quantization [135.4776759536272]
We present MELLE, a novel continuous-valued token based language modeling approach for text-to-speech synthesis (TTS)。
MELLEはテキスト条件から直接連続メル-スペクトログラムフレームを自動回帰生成する。
MELLEは、サンプリングベクトル量子化符号の固有の欠陥を回避し、ロバスト性問題を緩和する。
論文 参考訳(メタデータ) (2024-07-11T14:36:53Z) - HyPoradise: An Open Baseline for Generative Speech Recognition with
Large Language Models [81.56455625624041]
ASRの誤り訂正に外部の大規模言語モデル(LLM)を利用する最初のオープンソースベンチマークを導入する。
提案したベンチマークには、334,000組以上のN-best仮説を含む新しいデータセットHyPoradise (HP)が含まれている。
合理的なプロンプトと生成能力を持つLLMは、N-bestリストに欠けているトークンを修正できる。
論文 参考訳(メタデータ) (2023-09-27T14:44:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。