論文の概要: RAICL: Retrieval-Augmented In-Context Learning for Vision-Language-Model Based EEG Seizure Detection
- arxiv url: http://arxiv.org/abs/2601.17844v1
- Date: Sun, 25 Jan 2026 13:58:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.429802
- Title: RAICL: Retrieval-Augmented In-Context Learning for Vision-Language-Model Based EEG Seizure Detection
- Title(参考訳): RAICL:視覚言語モデルに基づく脳波シーズーア検出のための検索型インコンテキスト学習
- Authors: Siyang Li, Zhuoya Wang, Xiyan Gui, Xiaoqing Chen, Ziwei Wang, Yaozhi Wen, Dongrui Wu,
- Abstract要約: 本稿では,大規模な視覚言語モデル(VLM)を用いて脳波の波形プロットを解析することにより,従来の信号ベースデコーディングからパラダイムシフトを提案する。
本稿では,脳波信号の非定常性に対処するため,Retrieval-Augmented In-Context Learning (RAICL)アプローチを提案する。
- 参考スコア(独自算出の注目度): 12.189806103703887
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Electroencephalogram (EEG) decoding is a critical component of medical diagnostics, rehabilitation engineering, and brain-computer interfaces. However, contemporary decoding methodologies remain heavily dependent on task-specific datasets to train specialized neural network architectures. Consequently, limited data availability impedes the development of generalizable large brain decoding models. In this work, we propose a paradigm shift from conventional signal-based decoding by leveraging large-scale vision-language models (VLMs) to analyze EEG waveform plots. By converting multivariate EEG signals into stacked waveform images and integrating neuroscience domain expertise into textual prompts, we demonstrate that foundational VLMs can effectively differentiate between different patterns in the human brain. To address the inherent non-stationarity of EEG signals, we introduce a Retrieval-Augmented In-Context Learning (RAICL) approach, which dynamically selects the most representative and relevant few-shot examples to condition the autoregressive outputs of the VLM. Experiments on EEG-based seizure detection indicate that state-of-the-art VLMs under RAICL achieved better or comparable performance with traditional time series based approaches. These findings suggest a new direction in physiological signal processing that effectively bridges the modalities of vision, language, and neural activities. Furthermore, the utilization of off-the-shelf VLMs, without the need for retraining or downstream architecture construction, offers a readily deployable solution for clinical applications.
- Abstract(参考訳): 脳波デコード(Electroencephalogram、EEG)は、医療診断、リハビリテーション工学、脳とコンピュータのインターフェースにおいて重要な要素である。
しかし、現代の復号法は、特定のニューラルネットワークアーキテクチャを訓練するためにタスク固有のデータセットに大きく依存している。
その結果、データ可用性の制限により、一般化可能な大脳復号モデルの開発が妨げられる。
本稿では,大規模な視覚言語モデル(VLM)を活用して脳波プロットを解析することにより,従来の信号ベースデコーディングからパラダイムシフトを提案する。
多変量脳波信号を積み重ねた波形画像に変換し、神経科学領域の専門知識をテキストのプロンプトに統合することにより、基礎となるVLMが人間の脳の異なるパターンを効果的に区別できることを実証する。
脳波信号の非定常性に対処するために、我々は、VLMの自己回帰出力を条件付けるために、最も代表的で関連性の高い少数ショット例を動的に選択するRetrieval-Augmented In-Context Learning (RAICL)アプローチを導入する。
脳波による発作検出実験により、RAICLの下での最先端のVLMは、従来の時系列ベースのアプローチよりも優れた、あるいは同等の性能を示した。
これらの知見は、視覚、言語、神経活動のモダリティを効果的に橋渡しする生理的信号処理の新しい方向性を示唆している。
さらに、市販のVLMは、再訓練や下流アーキテクチャ構築を必要とせず、容易にデプロイ可能な臨床応用ソリューションを提供する。
関連論文リスト
- Variational decomposition autoencoding improves disentanglement of latent representations [14.3216921403324]
信号分解に対する強い構造バイアスを組み込むことで、VAEを拡張するフレームワークである変分分解自動符号化(VDA)を導入する。
VDAは変分分解オートエンコーダ(DecVAE)、すなわち信号分解モデル、コントラスト自己監督タスク、変分事前近似を組み合わせたエンコーダのみのニューラルネットワークによってインスタンス化される。
シミュレーションデータと3つの公開科学データセットに対するDecVAEsの有効性を実証し, 音声認識, 難聴度評価, 感情音声分類を行った。
論文 参考訳(メタデータ) (2026-01-11T10:16:34Z) - EEG-VLM: A Hierarchical Vision-Language Model with Multi-Level Feature Alignment and Visually Enhanced Language-Guided Reasoning for EEG Image-Based Sleep Stage Prediction [17.251077744298808]
脳波に基づく睡眠ステージ分類のための多段階特徴アライメントと言語誘導推論を統合した階層型視覚言語フレームワークであるEEG-VLMを提案する。
実験により,脳波を用いた睡眠段階分類において,VLMの精度と解釈性の両方が有意に向上することが確認された。
論文 参考訳(メタデータ) (2025-11-24T14:23:42Z) - NeuroRVQ: Multi-Scale EEG Tokenization for Generative Large Brainwave Models [66.91449452840318]
我々は、コードブックベースのトークン化装置を中心としたスケーラブルな大脳波モデル(LBM)であるNeuroRVQを紹介する。
我々のトークンライザは, (i) フル周波数のニューラルスペクトルを捕捉するマルチスケール特徴抽出モジュール, (ii) 高精細符号化のための階層的残留ベクトル量子化(RVQ)コードブック, (iii) 効率的なトレーニングのためのEEG信号位相および振幅認識損失関数を統合する。
実験の結果,NeuroRVQは再建誤差を低くし,様々な下流タスクにおいて既存のLBMよりも優れることがわかった。
論文 参考訳(メタデータ) (2025-10-15T01:26:52Z) - Spatial-Functional awareness Transformer-based graph archetype contrastive learning for Decoding Visual Neural Representations from EEG [3.661246946935037]
本稿では,脳波に基づく視覚的デコーディングを強化するために,空間認識変換器を用いたグラフアーチタイプコントラスト学習(SFTG)フレームワークを提案する。
具体的には、空間的脳の接続性と時間的神経力学を同時に符号化する新しいグラフベースのニューラルアーキテクチャであるEEG Graph Transformer(EGT)を紹介する。
高い対象内変動を緩和するために,特徴の整合性とクラス分離性を改善するために,主観固有の脳波グラフアーチタイプを学習するグラフアーチタイプコントラスト学習(GAC)を提案する。
論文 参考訳(メタデータ) (2025-09-29T13:27:55Z) - WaveMind: Towards a Conversational EEG Foundation Model Aligned to Textual and Visual Modalities [55.00677513249723]
脳波信号は認知過程と固有の神経状態の両方を同時に符号化する。
我々は、EEG信号とその対応するモダリティを統一意味空間にマッピングし、一般化された解釈を実現する。
結果として得られたモデルは、柔軟でオープンな会話をサポートしながら、堅牢な分類精度を示す。
論文 参考訳(メタデータ) (2025-09-26T06:21:51Z) - Large Cognition Model: Towards Pretrained EEG Foundation Model [0.0]
多様な脳波データセットと下流タスクをまたいだ一般化を目的としたトランスフォーマーベース基盤モデルを提案する。
本研究は, 神経科学, パーソナライズドメディカル, およびBCI技術の進歩を促進するための, 事前学習型脳波基盤モデルの可能性を明らかにするものである。
論文 参考訳(メタデータ) (2025-02-11T04:28:10Z) - CognitionCapturer: Decoding Visual Stimuli From Human EEG Signal With Multimodal Information [61.1904164368732]
脳波信号の表現にマルチモーダルデータを完全に活用する統合フレームワークであるCognitionCapturerを提案する。
具体的には、CognitionCapturerは、各モダリティに対してモダリティエキスパートを訓練し、EEGモダリティからモダリティ情報を抽出する。
このフレームワークは生成モデルの微調整を一切必要とせず、より多くのモダリティを組み込むように拡張することができる。
論文 参考訳(メタデータ) (2024-12-13T16:27:54Z) - MindFormer: Semantic Alignment of Multi-Subject fMRI for Brain Decoding [50.55024115943266]
本稿では,MindFormer を用いたマルチオブジェクト fMRI 信号のセマンティックアライメント手法を提案する。
このモデルは、fMRIから画像生成のための安定拡散モデルや、fMRIからテキスト生成のための大規模言語モデル(LLM)の条件付けに使用できるfMRI条件付き特徴ベクトルを生成するように設計されている。
実験の結果,MindFormerは意味的に一貫した画像とテキストを異なる主題にわたって生成することがわかった。
論文 参考訳(メタデータ) (2024-05-28T00:36:25Z) - A Knowledge-Driven Cross-view Contrastive Learning for EEG
Representation [48.85731427874065]
本稿では,限られたラベルを持つ脳波から効果的な表現を抽出する知識駆動型クロスビューコントラスト学習フレームワーク(KDC2)を提案する。
KDC2法は脳波信号の頭皮と神経のビューを生成し、脳活動の内部および外部の表現をシミュレートする。
ニューラル情報整合性理論に基づく事前のニューラル知識をモデル化することにより、提案手法は不変かつ相補的なニューラル知識を抽出し、複合表現を生成する。
論文 参考訳(メタデータ) (2023-09-21T08:53:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。