論文の概要: NeuroNarrator: A Generalist EEG-to-Text Foundation Model for Clinical Interpretation via Spectro-Spatial Grounding and Temporal State-Space Reasoning
- arxiv url: http://arxiv.org/abs/2603.16880v1
- Date: Tue, 24 Feb 2026 21:10:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.355781
- Title: NeuroNarrator: A Generalist EEG-to-Text Foundation Model for Clinical Interpretation via Spectro-Spatial Grounding and Temporal State-Space Reasoning
- Title(参考訳): NeuroNarrator: 分光的空間的接地と時間的空間的推論による臨床解釈のための一般脳波-テキスト基礎モデル
- Authors: Guoan Wang, Shihao Yang, Jun-en Ding, Hao Zhu, Feng Liu,
- Abstract要約: 我々は脳波からテキストへの基礎モデルであるNeuroNarratorを導入し、電気生理学的セグメントを正確な臨床物語に変換する。
このフレームワークの基盤はNeuroCorpus-160Kのキュレーションである。NeuroCorpus-160Kは、160,000のEEGセグメントに構造化され、臨床的に根拠付けられた自然言語記述を持つ最初の調和した大規模リソースペアである。
この基礎の上に構築し、歴史的時間的・スペクトル的文脈を統合した状態空間に着想を得た定式化を用いて、大規模言語モデルを構築し、一貫性のある臨床物語生成を支援する。
- 参考スコア(独自算出の注目度): 11.51370622964103
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electroencephalography (EEG) provides a non-invasive window into neural dynamics at high temporal resolution and plays a pivotal role in clinical neuroscience research. Despite this potential, prevailing computational approaches to EEG analysis remain largely confined to task-specific classification objectives or coarse-grained pattern recognition, offering limited support for clinically meaningful interpretation. To address these limitations, we introduce NeuroNarrator, the first generalist EEG-to-text foundation model designed to translate electrophysiological segments into precise clinical narratives. A cornerstone of this framework is the curation of NeuroCorpus-160K, the first harmonized large-scale resource pairing over 160,000 EEG segments with structured, clinically grounded natural-language descriptions. Our architecture first aligns temporal EEG waveforms with spatial topographic maps via a rigorous contrastive objective, establishing spectro-spatially grounded representations. Building on this grounding, we condition a Large Language Model through a state-space-inspired formulation that integrates historical temporal and spectral context to support coherent clinical narrative generation. This approach establishes a principled bridge between continuous signal dynamics and discrete clinical language, enabling interpretable narrative generation that facilitates expert interpretation and supports clinical reporting workflows. Extensive evaluations across diverse benchmarks and zero-shot transfer tasks highlight NeuroNarrator's capacity to integrate temporal, spectral, and spatial dynamics, positioning it as a foundational framework for time-frequency-aware, open-ended clinical interpretation of electrophysiological data.
- Abstract(参考訳): 脳波検査(EEG)は、高時間分解能で神経力学に非侵襲的な窓を提供し、臨床神経科学研究において重要な役割を担っている。
この可能性にもかかわらず、脳波分析に対する一般的な計算手法は、主にタスク固有の分類目的や粗粒度パターン認識に限られており、臨床的に意味のある解釈を限定的にサポートしている。
これらの制約に対処するために、電気生理学的セグメントを正確な臨床物語に変換するように設計された最初の一般の脳波からテキストへの基礎モデルであるNeuroNarratorを紹介する。
このフレームワークの基盤はNeuroCorpus-160Kのキュレーションである。NeuroCorpus-160Kは、160,000のEEGセグメントに構造化され、臨床的に根拠付けられた自然言語記述を持つ最初の調和した大規模リソースペアである。
我々のアーキテクチャは、まず時間的脳波波形を厳密なコントラスト目的による空間的地形図と整合させ、スペクトル-親密な基底表現を確立する。
この基礎の上に構築し、歴史的時間的・スペクトル的文脈を統合した状態空間に着想を得た定式化を用いて、大規模言語モデルを構築し、一貫性のある臨床物語生成を支援する。
このアプローチは、連続信号力学と離散臨床言語との原則的ブリッジを確立し、専門家の解釈を促進する解釈可能な物語生成を可能にし、臨床報告ワークフローをサポートする。
多様なベンチマークとゼロショット転送タスクにわたる広範囲な評価は、時間、スペクトル、空間力学を統合するニューロナレーターの能力を強調し、それを時間周波数を認識し、電気生理学的データのオープンな臨床解釈のための基礎的な枠組みとして位置づけている。
関連論文リスト
- Stringology-Based Motif Discovery from EEG Signals: an ADHD Case Study [0.0]
弦学の手法を用いて脳波時系列を解析するための新しい計算手法を提案する。
このフレームワークは順序保存マッチング(OPM)とカルテシアンツリーマッチング(CTM)に適応し、時間的モチーフを検出する。
以上の結果から,ADHD関連脳波変化は時間的パターンの系統的変化,安定性,階層的構造に影響を及ぼすことが示唆された。
論文 参考訳(メタデータ) (2026-03-03T19:44:55Z) - UniPACT: A Multimodal Framework for Prognostic Question Answering on Raw ECG and Structured EHR [15.533178197005208]
本稿では,このモダリティギャップを橋渡しする確率的質問に対する統一的な枠組みを提案する。
UniPACTのコアコントリビューションは、数値EHRデータを意味的にリッチなテキストに変換する構造化プロンプト機構である。
総合的なMDS-EDベンチマークで評価し、最先端のAUROCの89.37%を様々な予後タスクで達成した。
論文 参考訳(メタデータ) (2026-01-25T17:35:52Z) - BEAT-Net: Injecting Biomimetic Spatio-Temporal Priors for Interpretable ECG Classification [1.3909285316906435]
BEAT-NetはTokenizationフレームワークを用いたバイオミメティックECG分析である。
局所的なビート形態を抽出する特殊なエンコーダによって心臓生理を分解する。
例外的なデータ効率を示し、注釈付きデータの30~35%しか使用せずに、完全に教師付きのパフォーマンスを回復する。
論文 参考訳(メタデータ) (2026-01-12T08:37:47Z) - Interpretable Neuropsychiatric Diagnosis via Concept-Guided Graph Neural Networks [56.75602443936853]
青少年の5人に1人は、不安、うつ病、行動障害などの精神状態または行動の健康状態と診断されている。
従来の研究では、障害予測にグラフニューラルネットワーク(GNN)アプローチを使用していたが、ブラックボックスのままであり、信頼性と臨床翻訳を制限している。
本研究では,解釈可能な機能接続の概念を符号化する概念に基づく診断フレームワークを提案する。
我々の設計は臨床的に意味のある接続パターンを通じて予測を保証し、解釈可能性と強い予測性能の両方を可能にする。
論文 参考訳(メタデータ) (2025-10-02T19:38:46Z) - Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。
本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。
SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文 参考訳(メタデータ) (2025-09-30T08:59:06Z) - Time-Aware Attention for Enhanced Electronic Health Records Modeling [8.4225455796455]
TALE-EHR は Transformer ベースのフレームワークで,連続的な時間的ギャップを明示的にモデル化する,新たなタイムアウェアアテンション機構を備えている。
本手法は, 疾患進展予測などのタスクにおいて, 最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-07-20T07:32:41Z) - CodeBrain: Towards Decoupled Interpretability and Multi-Scale Architecture for EEG Foundation Model [52.466542039411515]
EEGファウンデーションモデル(EFM)は、タスク固有のモデルのスケーラビリティ問題に対処するために登場した。
このギャップを埋めるために設計された2段階のEMFであるCodeBrainを紹介します。
第1段階では、異種時間・周波数の脳波信号を離散トークンに分解するTFDual-Tokenizerを導入する。
第2段階では、構造化されたグローバル畳み込みとスライディングウインドウの注意を結合したマルチスケールEEGSSMアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-06-10T17:20:39Z) - PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。
PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文 参考訳(メタデータ) (2025-05-06T15:18:38Z) - Temporal Entailment Pretraining for Clinical Language Models over EHR Data [9.584923572354045]
臨床領域における言語モデルのための新しい時間的包含事前学習目標を提案する。
本手法は, EHRセグメントを時間的に順序付けられた文対として定式化し, 後の状態が先行状態に関係しているか, 矛盾しているか, 中立であるかを決定するようモデルを訓練する。
論文 参考訳(メタデータ) (2025-04-25T07:30:38Z) - Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives [83.15653194899126]
神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。
現在のVSNベースのNCD検出法は主にボトムアップ、刺激駆動認知プロセスと密接に結びついている言語マイクロ構造に焦点を当てている。
本稿では,話題の時間的変化を追跡する動的トピックモデル(DTM)と,物語と視覚刺激の相互整合性を測定するテキスト画像時間アライメントネットワーク(TITAN)の2つの新しいマクロ構造手法を提案する。
論文 参考訳(メタデータ) (2025-01-07T12:16:26Z) - fMRI from EEG is only Deep Learning away: the use of interpretable DL to
unravel EEG-fMRI relationships [68.8204255655161]
多チャンネル脳波データからいくつかの皮質下領域の活性を回復するための解釈可能な領域基底解を提案する。
我々は,皮質下核の血行動態信号の頭皮脳波予測の空間的・時間的パターンを復元する。
論文 参考訳(メタデータ) (2022-10-23T15:11:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。