論文の概要: CSBrain: A Cross-scale Spatiotemporal Brain Foundation Model for EEG Decoding
- arxiv url: http://arxiv.org/abs/2506.23075v1
- Date: Sun, 29 Jun 2025 03:29:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.705209
- Title: CSBrain: A Cross-scale Spatiotemporal Brain Foundation Model for EEG Decoding
- Title(参考訳): CSBrain: 脳波デコーディングのためのクロススケール時空間脳基盤モデル
- Authors: Yuchen Zhou, Jiamin Wu, Zichen Ren, Zhouheng Yao, Weiheng Lu, Kunyu Peng, Qihao Zheng, Chunfeng Song, Wanli Ouyang, Chao Gou,
- Abstract要約: 脳波信号の一般化のためのクロススケール時空間脳基盤モデルを提案する。
CSBrainはタスク固有のベースラインと基盤モデルのベースラインを一貫して上回ります。
これらの結果は、CSBrainを将来の脳-AI研究の強力なバックボーンとして、重要な帰納バイアスとして、クロススケールモデリングを確立している。
- 参考スコア(独自算出の注目度): 57.90382885533593
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding and decoding brain activity from electroencephalography (EEG) signals is a fundamental challenge in neuroscience and AI, with applications in cognition, emotion recognition, diagnosis, and brain-computer interfaces. While recent EEG foundation models advance generalized decoding via unified architectures and large-scale pretraining, they adopt a scale-agnostic dense modeling paradigm inherited from NLP and vision. This design neglects a core property of neural activity: cross-scale spatiotemporal structure. EEG task patterns span a wide range of temporal and spatial scales, from short bursts to slow rhythms, and from localized cortical responses to distributed interactions. Ignoring this diversity leads to suboptimal representations and weak generalization. We propose CSBrain, a Cross-scale Spatiotemporal Brain foundation model for generalized EEG decoding. CSBrain introduces: (i) Cross-scale Spatiotemporal Tokenization (CST), which aggregates multi-scale features from localized temporal windows and anatomical brain regions into compact scale-aware tokens; and (ii) Structured Sparse Attention (SSA), which captures cross-window and cross-region dependencies, enhancing scale diversity while removing spurious correlations. CST and SSA are alternately stacked to progressively integrate multi-scale dependencies. Experiments on 11 EEG tasks across 16 datasets show that CSBrain consistently outperforms task-specific and foundation model baselines. These results establish cross-scale modeling as a key inductive bias and position CSBrain as a robust backbone for future brain-AI research.
- Abstract(参考訳): 脳波(EEG)信号からの脳活動の理解と復号は、認知、感情認識、診断、脳とコンピュータのインターフェイスなど、神経科学とAIの基本的な課題である。
最近のEEGファンデーションモデルは、統一アーキテクチャと大規模事前訓練によって一般化された復号化を進める一方で、NLPとビジョンから継承されたスケールに依存しない高密度モデリングパラダイムを採用する。
この設計は神経活動の中核的な性質を無視している。
脳波のタスクパターンは、短いバーストから遅いリズム、局所的な皮質反応から分散相互作用まで、幅広い時間的・空間的スケールにまたがる。
この多様性を無視することは、準最適表現と弱一般化につながる。
一般化された脳波復号のためのクロススケール時空間脳基盤モデルCSBrainを提案する。
CSBrainが紹介する。
一 局所的側頭窓及び解剖学的脳領域からのマルチスケール特徴をコンパクトなスケール対応トークンに集約するクロススケール時空間トークン化(CST)
(II)SSA(Structured Sparse Attention)は,ウィンドウとクロスリージョンの依存関係を捕捉し,スケールの多様性を高めつつ,素早い相関関係を除去する。
CSTとSSAは、段階的にマルチスケール依存関係を統合するために、交互にスタックされる。
16データセットにわたる11のEEGタスクの実験は、CSBrainがタスク固有のベースラインとファンデーションモデルベースラインを一貫して上回っていることを示している。
これらの結果は、CSBrainを将来の脳-AI研究の強力なバックボーンとして、重要な帰納バイアスとして、クロススケールモデリングを確立している。
関連論文リスト
- Brain2Vec: A Deep Learning Framework for EEG-Based Stress Detection Using CNN-LSTM-Attention [0.0]
Brain2Vecは、生の脳波記録からストレス状態を分類する新しいディープラーニングツールだ。
これらの結果は、Brain2Vecがウェアラブルストレス監視プラットフォームとパーソナライズされたヘルスケアシステムに統合される可能性を示している。
論文 参考訳(メタデータ) (2025-06-12T12:57:19Z) - CodeBrain: Bridging Decoupled Tokenizer and Multi-Scale Architecture for EEG Foundation Model [33.550819280074826]
EEGファンデーションモデルは、マルチスケールの脳依存を捉える上で、限られた異種表現能力と非効率性に苦しむ。
我々は,脳組織に適応した効率的なEMFであるCodeBrainを2段階の訓練で提案する。
EEGSSMは、構造化されたグローバルな畳み込みアーキテクチャとスライディングウィンドウアテンション機構を組み合わせて、スパースな長距離および局所的な依存関係を共同でモデル化する。
論文 参考訳(メタデータ) (2025-06-10T17:20:39Z) - BrainOmni: A Brain Foundation Model for Unified EEG and MEG Signals [50.76802709706976]
異種脳波とMEG記録を対象とする脳基礎モデルBrain Omniを提案する。
多様なデータソースを統一するために、脳の活動を離散表現に定量化する最初のトークンであるBrainTokenizerを紹介します。
EEGの合計1,997時間、MEGデータの656時間は、事前トレーニングのために公開されているソースからキュレーションされ、標準化されている。
論文 参考訳(メタデータ) (2025-05-18T14:07:14Z) - BrainMAP: Learning Multiple Activation Pathways in Brain Networks [77.15180533984947]
本稿では,脳ネットワークにおける複数の活性化経路を学習するための新しいフレームワークであるBrainMAPを紹介する。
本フレームワークは,タスクに関わる重要な脳領域の説明的分析を可能にする。
論文 参考訳(メタデータ) (2024-12-23T09:13:35Z) - Knowledge-Guided Prompt Learning for Lifespan Brain MR Image Segmentation [53.70131202548981]
本稿では,脳MRIにKGPL(Knowledge-Guided Prompt Learning)を用いた2段階のセグメンテーションフレームワークを提案する。
具体的には,大規模データセットと準最適ラベルを用いたトレーニング前セグメンテーションモデルについて述べる。
知識的プロンプトの導入は、解剖学的多様性と生物学的プロセスの間の意味的関係を捉えている。
論文 参考訳(メタデータ) (2024-07-31T04:32:43Z) - Interpretable Spatio-Temporal Embedding for Brain Structural-Effective Network with Ordinary Differential Equation [56.34634121544929]
本研究では,まず動的因果モデルを用いて脳効果ネットワークを構築する。
次に、STE-ODE(Spatio-Temporal Embedding ODE)と呼ばれる解釈可能なグラフ学習フレームワークを導入する。
このフレームワークは、構造的および効果的なネットワーク間の動的相互作用を捉えることを目的とした、特異的に設計されたノード埋め込み層を含んでいる。
論文 参考訳(メタデータ) (2024-05-21T20:37:07Z) - Du-IN: Discrete units-guided mask modeling for decoding speech from Intracranial Neural signals [5.283718601431859]
エレクトロコルチコグラフィー(ECoG)を用いた脳-コンピュータインタフェースは,医療応用における高性能音声復号化を約束している。
離散コーデックス誘導マスクモデリングにより,領域レベルのトークンに基づくコンテキスト埋め込みを抽出するDu-INモデルを開発した。
本モデルでは,61ワードの分類タスクにおいて,すべてのベースラインを越えながら最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-05-19T06:00:36Z) - MBrain: A Multi-channel Self-Supervised Learning Framework for Brain
Signals [7.682832730967219]
本稿では,SEEGデータとEEGデータのいずれかを事前学習できる脳信号の自己教師型学習フレームワークについて検討する。
そこで我々は,異なるチャネル間の空間的および時間的相関を暗黙的に学習するために,MBrainを提案する。
我々のモデルは、最先端のSSLおよび教師なしモデルよりも優れており、臨床に展開する能力を持っている。
論文 参考訳(メタデータ) (2023-06-15T09:14:26Z) - Language Knowledge-Assisted Representation Learning for Skeleton-Based
Action Recognition [71.35205097460124]
人間が他人の行動を理解して認識する方法は、複雑な神経科学の問題である。
LA-GCNは、大規模言語モデル(LLM)知識アシストを用いたグラフ畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-21T08:29:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。