論文の概要: SpecMoE: Spectral Mixture-of-Experts Foundation Model for Cross-Species EEG Decoding
- arxiv url: http://arxiv.org/abs/2603.16739v1
- Date: Tue, 17 Mar 2026 16:20:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.410038
- Title: SpecMoE: Spectral Mixture-of-Experts Foundation Model for Cross-Species EEG Decoding
- Title(参考訳): SpecMoE: クロススペクトル脳波復号のためのスペクトル混合スペクトル基礎モデル
- Authors: D. Darankoum, C. Habermacher, J. Volle, S. Grudinin,
- Abstract要約: SpecMoEは、学習されたスペクトルゲーティングメカニズムによってガイドされるエキスパートフレームワークの混合である。
睡眠ステージング、感情認識、運動像分類、異常信号検出、薬物効果予測など、さまざまな脳波デコーディングタスクのセットで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Decoding the orchestration of neural activity in electroencephalography (EEG) signals is a central challenge in bridging neuroscience with artificial intelligence. Foundation models have made strides in generalized EEG decoding, yet many existing frameworks primarily relying on separate temporal and spectral masking of raw signals during self-supervised pretraining. Such strategies often tend to bias learning toward high-frequency oscillations, as low-frequency rhythmic patterns can be easily inferred from the unmasked signal. We introduce a foundation model that utilizes a novel Gaussian-smoothed masking scheme applied to short-time Fourier transform (STFT) maps. By jointly applying time, frequency, and time-frequency Gaussian masks, we make the reconstruction task much more challenging, forcing the model to learn intricate neural patterns across both high- and low-frequency domains. To effectively recover signals under this aggressive masking strategy, we design SpecHi-Net, a U-shaped hierarchical architecture with multiple encoding and decoding stages. To accelerate large-scale pretraining, we partition the data into three subsets, each used to train an independent expert model. We then combine these models through SpecMoE, a mixture of experts framework guided by a learned spectral gating mechanism. SpecMoE achieves state-of-the-art performance across a diverse set of EEG decoding tasks, including sleep staging, emotion recognition, motor imagery classification, abnormal signal detection, and drug effect prediction. Importantly, the model demonstrates strong cross-species and cross-subject generalization, maintaining high accuracy on both human and murine EEG datasets.
- Abstract(参考訳): 脳波(EEG)信号における神経活動のオーケストレーションのデコードは、人工知能による神経科学のブリッジングにおける中心的な課題である。
ファンデーションモデルは、一般化されたEEGデコーディングを推進してきたが、既存の多くのフレームワークは、主に自己教師付き事前訓練中に生信号の時間的およびスペクトル的マスキングを分離に依存している。
このような戦略は、低周波のリズムパターンを無音信号から容易に推測できるため、高周波数の振動に対してバイアス学習を行う傾向がある。
本稿では,短時間フーリエ変換(STFT)マップに適用した新しいガウス平滑マスキング方式を用いた基礎モデルを提案する。
時間、周波数、時間周波数のガウスマスクを併用することにより、復元作業をより困難にし、高周波数領域と低周波数領域の両方にわたる複雑なニューラルネットワークパターンを学習させます。
このアグレッシブマスキング戦略の下で信号を効果的に回収するために,複数の符号化および復号段階を有するU字型階層アーキテクチャであるSpecHi-Netを設計した。
大規模プレトレーニングを高速化するために、データを3つのサブセットに分割し、それぞれが独立したエキスパートモデルをトレーニングする。
次に、これらのモデルを、学習されたスペクトルゲーティングメカニズムによってガイドされた専門家フレームワークであるSpecMoEを通じて組み合わせます。
SpecMoEは睡眠ステージング、感情認識、運動像分類、異常信号検出、薬物効果予測など、さまざまな脳波デコーディングタスクのセットで最先端のパフォーマンスを達成する。
重要なことに、このモデルは強いクロス種とクロスオブジェクトの一般化を示し、ヒトとマウスの脳波データセットの精度を維持している。
関連論文リスト
- BrainRVQ: A High-Fidelity EEG Foundation Model via Dual-Domain Residual Quantization and Hierarchical Autoregression [26.114257185901838]
臨床脳波データの大規模コーパスを事前学習した汎用脳波基礎モデルであるBrainRVQを提案する。
BrainRVQはDual-Domain Residual Vector Quantization (DD-RVQ)トークンを特徴としている。
論文 参考訳(メタデータ) (2026-02-18T23:30:36Z) - Self-Supervised Learning via Flow-Guided Neural Operator on Time-Series Data [57.85958428020496]
Flow-Guided Neural Operator (FGNO)は、演算子学習とフローマッチングを組み合わせた新しいフレームワークである。
FGNOは、短時間フーリエ変換を用いて関数空間のマッピングを学習し、異なる時間分解能を統一する。
推論中にノイズのある入力を使用する以前の生成SSL法とは異なり、ノイズのある表現を学習しながら、クリーンな入力を用いて表現抽出を行う。
論文 参考訳(メタデータ) (2026-02-12T18:54:57Z) - SPECTRE: Spectral Pre-training Embeddings with Cylindrical Temporal Rotary Position Encoding for Fine-Grained sEMG-Based Movement Decoding [16.992187199187764]
非侵襲的表面筋電図(sEMG)からの微細な運動の復号は、信号非定常性と低信号-雑音比による補綴制御の課題である。
これらの制限を克服するために、ドメイン固有のSSLフレームワークであるSPECTREを紹介します。
SPECTREは動作復号化のための新しい最先端技術を確立し、教師付きベースラインと汎用SSLアプローチの両方を著しく上回っていることを示す。
論文 参考訳(メタデータ) (2025-12-27T05:55:06Z) - FusAD: Time-Frequency Fusion with Adaptive Denoising for General Time Series Analysis [92.23551599659186]
時系列分析は、金融、医療、産業、気象学などの分野において重要な役割を果たす。
FusADは多様な時系列タスク用に設計された統合分析フレームワークである。
論文 参考訳(メタデータ) (2025-12-16T04:34:27Z) - NeuroRVQ: Multi-Scale EEG Tokenization for Generative Large Brainwave Models [66.91449452840318]
我々は、コードブックベースのトークン化装置を中心としたスケーラブルな大脳波モデル(LBM)であるNeuroRVQを紹介する。
我々のトークンライザは, (i) フル周波数のニューラルスペクトルを捕捉するマルチスケール特徴抽出モジュール, (ii) 高精細符号化のための階層的残留ベクトル量子化(RVQ)コードブック, (iii) 効率的なトレーニングのためのEEG信号位相および振幅認識損失関数を統合する。
実験の結果,NeuroRVQは再建誤差を低くし,様々な下流タスクにおいて既存のLBMよりも優れることがわかった。
論文 参考訳(メタデータ) (2025-10-15T01:26:52Z) - T2I-Diff: fMRI Signal Generation via Time-Frequency Image Transform and Classifier-Free Denoising Diffusion Models [10.21645911536505]
本稿では,BOLD信号の時間周波数表現を利用するfMRI生成フレームワークであるT2I-Diffを紹介する。
ダウンストリームfMRIを用いた脳ネットワーク分類において,精度の向上と一般化を実証した。
論文 参考訳(メタデータ) (2025-09-25T07:08:19Z) - Masked Autoencoders for Ultrasound Signals: Robust Representation Learning for Downstream Applications [0.0]
1次元(1D)超音波信号を用いた自己教師あり表現学習のための視覚変換器 (ViT) アーキテクチャを用いたマスク付きオートエンコーダ (MAE) の適応と性能について検討した。
以上の結果から,学習前のモデルでは,スクラッチからトレーニングしたモデルと,下流タスクに最適化された強力な畳み込みニューラルネットワーク(CNN)ベースラインが有意に優れていた。
論文 参考訳(メタデータ) (2025-08-28T10:13:33Z) - ALFEE: Adaptive Large Foundation Model for EEG Representation [17.166788472910806]
本稿では,脳波信号表現(ALFEE)フレームワークのための適応大基礎モデルを提案する。
ALFEEは、堅牢な脳波表現学習のための2つの学習段階を持つ、新しいハイブリッドトランスフォーマーアーキテクチャである。
25,000時間の事前トレーニングの後、6つの下流脳波タスクに関する広範な実験結果が、既存のモデルよりもALFEEの方が優れた性能を示している。
論文 参考訳(メタデータ) (2025-05-07T13:32:31Z) - PSDNorm: Test-Time Temporal Normalization for Deep Learning in Sleep Staging [63.05435596565677]
我々は,モンジュマッピングと時間文脈を利用したPSDNormを提案し,信号の深層学習モデルにおける特徴写像の正規化を行う。
PSDNormは、BatchNormよりも4倍のデータ効率が高く、目に見えない左のデータセットで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-06T16:20:25Z) - Detecting Anomalies in Dynamic Graphs via Memory enhanced Normality [39.476378833827184]
動的グラフにおける異常検出は、グラフ構造と属性の時間的進化によって大きな課題となる。
時空間記憶強調グラフオートエンコーダ(STRIPE)について紹介する。
STRIPEは、AUCスコアが5.8%改善し、トレーニング時間が4.62倍速く、既存の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-03-14T02:26:10Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。