論文の概要: A Multi-dimensional Framework for Evaluating Generalization in EEG Foundation Models
- arxiv url: http://arxiv.org/abs/2605.28563v1
- Date: Wed, 27 May 2026 14:51:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.129968
- Title: A Multi-dimensional Framework for Evaluating Generalization in EEG Foundation Models
- Title(参考訳): 脳波基礎モデルにおける一般化評価のための多次元フレームワーク
- Authors: Aditya Kommineni, Emily Zhou, Kleanthis Avramidis, Tiantian Feng, Shrikanth Narayanan,
- Abstract要約: 最近のEEGファンデーションモデルは、タスクとデータセット間で有望な転送機能を示している。
低リソース環境下での脳波モデル評価のための多次元評価フレームワークを提案する。
- 参考スコア(独自算出の注目度): 48.385356148620815
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Evaluating foundation models under appropriate adaptation settings is essential for understanding the quality and transferability of the learned representations. Recent EEG foundation models have demonstrated promising transfer capabilities across tasks and datasets, motivating their growing use in neurotechnology and clinical applications. However, these models are typically evaluated under full fine-tuning on well-curated downstream datasets, a setting that does not reflect biomedical domain constraints such as limited labeled data, reduced sensor coverage, or parameter-efficient adaptation. In this work, we propose a multi-dimensional evaluation framework for assessing EEG models under realistic low-resource conditions. Empirical analysis of both supervised EEG models and recent EEG foundation models, including LaBraM, CSBrain, and CBraMod, across 6 different datasets is performed under the proposed multi-dimensional evaluation framework. We find that EEG foundation models consistently provide performance gains on long-context tasks such as sleep stage prediction and mental health state classification. In contrast, for short-window Brain Computer Interface style tasks, supervised models achieve comparable despite having substantially fewer parameters. Additional analyses demonstrate that current foundation models provide limited robustness to short-window tasks and channel constrained settings. Together, these findings motivate the use of multi-dimensional evaluation protocols that characterize model behavior under realistic use constraints.
- Abstract(参考訳): 適切な適応条件下で基礎モデルを評価することは、学習した表現の品質と伝達可能性を理解するために不可欠である。
最近の脳波基礎モデルでは、タスクやデータセット間で有望な伝達能力を示しており、ニューロテクノロジーや臨床応用での利用が増加している。
しかし、これらのモデルは通常、よく計算された下流データセットの完全な微調整の下で評価される。これは、限られたラベル付きデータ、センサーカバレッジの低減、パラメータ効率の適応といった、生物医学的な領域の制約を反映しない設定である。
本研究では,現実的な低リソース環境下での脳波モデル評価のための多次元評価フレームワークを提案する。
ラブラム、CSBrain、CBraModを含む教師付き脳波モデルと最近の脳波基礎モデルの実証分析は、提案した多次元評価フレームワークの下で6つの異なるデータセットにわたって行われる。
脳波基礎モデルでは、睡眠ステージ予測やメンタルヘルス状態の分類といった長期的作業において、常にパフォーマンスの向上が期待できる。
対照的に、短いウィンドウのBrain Computer Interfaceスタイルのタスクでは、かなり少ないパラメータを持つにもかかわらず、教師付きモデルは同等に達成される。
さらなる分析により、現在の基礎モデルはショートウインドウのタスクやチャンネルの制約された設定に対して、限られた堅牢性を提供することが示された。
これらの知見は,現実的な使用制約下でのモデル動作を特徴付ける多次元評価プロトコルの利用を動機付けている。
関連論文リスト
- Test-Time Adaptation for EEG Foundation Models: A Systematic Study under Real-World Distribution Shifts [15.005225130424819]
テスト時適応(TTA)は、ソースデータにアクセスすることなく、推論中にラベルなしのターゲットデータに適応できるようにすることで、有望なソリューションを提供する。
本稿では,脳波基礎モデル上でのテスト時間適応手法を評価するためのベンチマークであるNeuroAdapt-Benchを紹介する。
以上の結果から, 標準TTA法では不整合ゲインが得られ, 性能が低下する傾向がみられた。
論文 参考訳(メタデータ) (2026-04-18T09:23:25Z) - EEG Foundation Models: Progresses, Benchmarking, and Open Problems [10.447009984769819]
我々は、50の代表的なEEG基盤モデルをレビューし、その設計選択を統合された分類学的枠組みにまとめる。
9つのBCIパラダイムにまたがる13のEEGデータセットに対して、12のオープンソースファンデーションモデルと、競合するスペシャリストベースラインを評価します。
論文 参考訳(メタデータ) (2026-01-25T15:28:50Z) - PerturBench: Benchmarking Machine Learning Models for Cellular Perturbation Analysis [8.785345412061792]
摂動に対する単一細胞転写応答をモデル化するための包括的枠組みを提案する。
私たちのアプローチには、モジュラーでユーザフレンドリなモデル開発と評価プラットフォームが含まれています。
モード崩壊など、広く使われているモデルの限界を強調します。
論文 参考訳(メタデータ) (2024-08-20T07:40:20Z) - Benchmarks as Microscopes: A Call for Model Metrology [76.64402390208576]
現代の言語モデル(LM)は、能力評価において新たな課題を提起する。
メトリクスに自信を持つためには、モデルミアロジの新たな規律が必要です。
論文 参考訳(メタデータ) (2024-07-22T17:52:12Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。