論文の概要: ELASTIQ: EEG-Language Alignment with Semantic Task Instruction and Querying
- arxiv url: http://arxiv.org/abs/2509.24302v1
- Date: Mon, 29 Sep 2025 05:29:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.764217
- Title: ELASTIQ: EEG-Language Alignment with Semantic Task Instruction and Querying
- Title(参考訳): ELASTIQ:セマンティックタスク命令とクエリによるEEG-Languageアライメント
- Authors: Muyun Jiang, Shuailei Zhang, Zhenjie Yang, Mengjun Wu, Weibang Jiang, Zhiwei Guo, Wei Zhang, Rui Liu, Shangen Zhang, Yong Li, Yi Ding, Cuntai Guan,
- Abstract要約: 本稿では,セマンティックタスク命令とクエリによるEEG-Language Alignmentの基礎モデルであるELASTIQを提案する。
ELASTIQは、タスク認識のセマンティックガイダンスを統合し、構造化され言語的に整合したEEG埋め込みを生成する。
運動画像,感情認識,定常的視覚誘発電位,隠蔽音声,医療タスクを対象とする20のデータセット上でELASTIQを評価した。
- 参考スコア(独自算出の注目度): 29.301155351226765
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in electroencephalography (EEG) foundation models, which capture transferable EEG representations, have greatly accelerated the development of brain-computer interfaces (BCI). However, existing approaches still struggle to incorporate language instructions as prior constraints for EEG representation learning, limiting their ability to leverage the semantic knowledge inherent in language to unify different labels and tasks. To address this challenge, we present ELASTIQ, a foundation model for EEG-Language Alignment with Semantic Task Instruction and Querying. ELASTIQ integrates task-aware semantic guidance to produce structured and linguistically aligned EEG embeddings, thereby enhancing decoding robustness and transferability. In the pretraining stage, we introduce a joint Spectral-Temporal Reconstruction (STR) module, which combines frequency masking as a global spectral perturbation with two complementary temporal objectives: random masking to capture contextual dependencies and causal masking to model sequential dynamics. In the instruction tuning stage, we propose the Instruction-conditioned Q-Former (IQF), a query-based cross-attention transformer that injects instruction embeddings into EEG tokens and aligns them with textual label embeddings through learnable queries. We evaluate ELASTIQ on 20 datasets spanning motor imagery, emotion recognition, steady-state visual evoked potentials, covert speech, and healthcare tasks. ELASTIQ achieves state-of-the-art performance on 14 of the 20 datasets and obtains the best average results across all five task categories. Importantly, our analyses reveal for the first time that explicit task instructions serve as semantic priors guiding EEG embeddings into coherent and linguistically grounded spaces. The code and pre-trained weights will be released.
- Abstract(参考訳): 脳波基礎モデル(EEG)の最近の進歩は、脳-コンピュータインターフェース(BCI)の開発を著しく加速させてきた。
しかし、既存のアプローチは、言語命令をEEG表現学習の事前の制約として組み込むことに苦慮しており、言語固有の意味的知識を活用して異なるラベルやタスクを統一する能力を制限する。
この課題に対処するために,セマンティックタスク命令とクエリによるEEG-Language Alignmentの基礎モデルであるELASTIQを提案する。
ELASTIQは、タスク認識のセマンティックガイダンスを統合して、構造化され言語的に整合したEEG埋め込みを生成する。
事前学習段階では、周波数マスキングを大域スペクトル摂動として組み合わせたスペクトル・テンポラル再構成(STR)モジュールと、文脈依存を捉えるランダムマスキングと因果マスキングの2つの相補的な時間的目的を組み合わせ、逐次的ダイナミクスをモデル化する。
Instruction-conditioned Q-Former (IQF) は、命令をEEGトークンに注入し、学習可能なクエリを通してテキストラベルの埋め込みと整合させるクエリベースのクロスアテンショントランスフォーマーである。
運動画像,感情認識,定常的視覚誘発電位,隠蔽音声,医療タスクを対象とする20のデータセット上でELASTIQを評価した。
ELASTIQは、20のデータセットのうち14の最先端のパフォーマンスを達成し、5つのタスクカテゴリで最高の平均結果を得る。
重要なことは、明示的なタスク命令が脳波の埋め込みをコヒーレントで言語的に根ざした空間に導く意味的前提として機能することを明らかにすることである。
コードと事前訓練されたウェイトがリリースされる。
関連論文リスト
- Query Expansion in the Age of Pre-trained and Large Language Models: A Comprehensive Survey [21.764997953030857]
i)クエリ拡張の4次元フレームワーク,(ii)エンコーダのみ,エンコーダデコーダ,デコーダのみ,命令チューニング,ドメイン/マルチティンガル変種にまたがるモデル中心の分類,(iii)ニューラルQEがファーストステージ検索にどのように役立つか,というプラクティス指向のガイダンスから,フィールドを合成する。
従来のクエリ拡張とPLM/LLMベースの7つの重要な側面を比較し、Web検索、バイオメディシン、eコマース、オープンドメインQA/RAG、会話型およびコード検索、クロスマップする。
論文 参考訳(メタデータ) (2025-09-09T14:31:11Z) - Learning Interpretable Representations Leads to Semantically Faithful EEG-to-Text Generation [52.51005875755718]
我々は脳波からテキストへの復号に焦点をあて、後部崩壊のレンズを通して幻覚の問題に対処する。
脳波とテキスト間の情報容量のミスマッチを認め、デコードタスクをコア意味のセマンティックな要約として再設計する。
パブリックなZuCoデータセットの実験では、GLIMが一貫して、流動的なEEG基底文を生成することが示されている。
論文 参考訳(メタデータ) (2025-05-21T05:29:55Z) - A Dual-Directional Context-Aware Test-Time Learning for Text Classification [17.38491257321053]
動的双方向エルマン注意ネットワーク(DBEAN)を提案する。
DBEANは双方向の時間的モデリングと自己注意を組み合わせる。
クリティカルな入力セグメントを動的に重み付けし、計算効率を維持する。
論文 参考訳(メタデータ) (2025-03-19T17:45:13Z) - Decoding EEG Speech Perception with Transformers and VAE-based Data Augmentation [6.405846203953988]
脳波からのデコード音声は脳-コンピュータインターフェース(BCI)を進展させる可能性がある
EEGベースの音声デコーディングは、ノイズの多いデータ、限られたデータセット、音声認識のような複雑なタスクにおけるパフォーマンスの低下など、大きな課題に直面している。
本研究では,データ品質向上のために,変動型オートエンコーダ(VAE)をEEGデータ拡張に適用することにより,これらの課題に対処する。
論文 参考訳(メタデータ) (2025-01-08T08:55:10Z) - Towards Linguistic Neural Representation Learning and Sentence Retrieval from Electroencephalogram Recordings [27.418738450536047]
脳波信号を文に変換するための2ステップパイプラインを提案する。
まず,自然読解中に記録された脳波データから単語レベルの意味情報を学習できることを確認する。
脳波エンコーダからの予測に基づいて文章を検索するために,学習不要な検索手法を用いる。
論文 参考訳(メタデータ) (2024-08-08T03:40:25Z) - Enhancing EEG-to-Text Decoding through Transferable Representations from Pre-trained Contrastive EEG-Text Masked Autoencoder [69.7813498468116]
コントラスト型脳波テキストマスケード自動エンコーダ(CET-MAE)を提案する。
また、E2T-PTR(Pretrained Transferable Representationsを用いたEEG-to-Text decoding)と呼ばれるフレームワークを開発し、EEGシーケンスからテキストをデコードする。
論文 参考訳(メタデータ) (2024-02-27T11:45:21Z) - Slot Induction via Pre-trained Language Model Probing and Multi-level
Contrastive Learning [62.839109775887025]
トークンレベルのスロットアノテーションの明示的な知識なしでスロット境界を誘導することを目的としたスロットインジェクション(SI)タスク。
PLMから抽出した教師なし意味知識を活用するために、教師なし事前学習言語モデル(PLM)探索とコントラスト学習機構を活用することを提案する。
提案手法は,2つのNLUベンチマークデータセット上でトークンレベルの教師付きモデルとのギャップを埋めることができ,SIタスクに有効であることが示されている。
論文 参考訳(メタデータ) (2023-08-09T05:08:57Z) - Prompting Language Models for Linguistic Structure [73.11488464916668]
本稿では,言語構造予測タスクに対する構造化プロンプト手法を提案する。
提案手法は, 音声タグ付け, 名前付きエンティティ認識, 文チャンキングについて評価する。
PLMはタスクラベルの事前知識を事前学習コーパスに漏えいすることで有意な事前知識を含むが、構造化プロンプトは任意のラベルで言語構造を復元することも可能である。
論文 参考訳(メタデータ) (2022-11-15T01:13:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。