論文の概要: Federated Learning for Epileptic Seizure Prediction Across Heterogeneous EEG Datasets
- arxiv url: http://arxiv.org/abs/2508.08159v1
- Date: Mon, 11 Aug 2025 16:36:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.21154
- Title: Federated Learning for Epileptic Seizure Prediction Across Heterogeneous EEG Datasets
- Title(参考訳): 不均質脳波データを用いた懐疑的静注予測のためのフェデレートラーニング
- Authors: Cem Ata Baykara, Saurav Raj Pandey, Ali Burak Ünal, Harlin Lee, Mete Akgün,
- Abstract要約: 本稿では,4つのパブリックデータセット(Siena,CHB-MIT,Helsinki,NCH)にまたがる単一EEGチャネルを用いた発作予測のためのFLについて検討する。
プライバシ保護のグローバルな正規化を実装し,各クライアントがラウンドごとのデータの固定サイズのランダムサブセットをトレーニングし,アグリゲーション中に同等のコントリビューションを確保するランダムサブセットアグリゲーション戦略を提案する。
以上の結果から, 局所学習モデルではサイト全体の一般化が困難であり, 標準重み付きFedAvgは高度に歪んだ性能が得られる(CHB-MITでは89.0%, ヘルシンキでは50.8%, NCHでは50.6%)。
- 参考スコア(独自算出の注目度): 2.5069344340760717
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing accurate and generalizable epileptic seizure prediction models from electroencephalography (EEG) data across multiple clinical sites is hindered by patient privacy regulations and significant data heterogeneity (non-IID characteristics). Federated Learning (FL) offers a privacy-preserving framework for collaborative training, but standard aggregation methods like Federated Averaging (FedAvg) can be biased by dominant datasets in heterogeneous settings. This paper investigates FL for seizure prediction using a single EEG channel across four diverse public datasets (Siena, CHB-MIT, Helsinki, NCH), representing distinct patient populations (adult, pediatric, neonate) and recording conditions. We implement privacy-preserving global normalization and propose a Random Subset Aggregation strategy, where each client trains on a fixed-size random subset of its data per round, ensuring equal contribution during aggregation. Our results show that locally trained models fail to generalize across sites, and standard weighted FedAvg yields highly skewed performance (e.g., 89.0% accuracy on CHB-MIT but only 50.8% on Helsinki and 50.6% on NCH). In contrast, Random Subset Aggregation significantly improves performance on under-represented clients (accuracy increases to 81.7% on Helsinki and 68.7% on NCH) and achieves a superior macro-average accuracy of 77.1% and pooled accuracy of 80.0% across all sites, demonstrating a more robust and fair global model. This work highlights the potential of balanced FL approaches for building effective and generalizable seizure prediction systems in realistic, heterogeneous multi-hospital environments while respecting data privacy.
- Abstract(参考訳): 脳波(EEG)データから複数の臨床部位にまたがる正確なて一般化可能なてんかん発作予測モデルの開発は、患者のプライバシ規則と重要なデータ不均一性(非IID特性)によって妨げられている。
Federated Learning(FL)は、協調トレーニングのためのプライバシ保護フレームワークを提供するが、Federated Averaging(FedAvg)のような標準アグリゲーションメソッドは、ヘテロジニアスな設定で支配的なデータセットによってバイアスを受けることができる。
本稿では,4つの公共データセット (Siena, CHB-MIT, Helsinki, NCH) にまたがる単一の脳波チャンネルを用いて, 患者集団(成人, 小児, 新生児)と記録条件を表わしたFLについて検討した。
プライバシ保護のグローバルな正規化を実装し,各クライアントがラウンドごとのデータの固定サイズのランダムサブセットをトレーニングし,アグリゲーション中に同等のコントリビューションを確保するランダムサブセットアグリゲーション戦略を提案する。
以上の結果から, 局所学習モデルではサイト全体の一般化が困難であり, 標準重み付きFedAvgは高度に歪んだ性能が得られる(CHB-MITでは89.0%, ヘルシンキでは50.8%, NCHでは50.6%)。
対照的に、ランダム・サブセット・アグリゲーション(Random Subset Aggregation)は、表現されていないクライアントのパフォーマンスを大幅に向上させ(ヘルシンキでは81.7%、NCHでは68.7%)、より優れたマクロ平均精度77.1%、全てのサイトにおいて80.0%の精度を実現し、より堅牢で公正なグローバルモデルを示している。
この研究は、データプライバシを尊重しつつ、現実的で異質なマルチホスピタル環境において、効果的で一般化可能な発作予測システムを構築するためのバランスのとれたFLアプローチの可能性を強調する。
関連論文リスト
- Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - Advancing Tabular Stroke Modelling Through a Novel Hybrid Architecture and Feature-Selection Synergy [0.9999629695552196]
本研究は、ストロークを予測するように設計されたデータ駆動型、解釈可能な機械学習フレームワークを開発し、検証する。
定期的に収集された人口統計、生活習慣、臨床変数は4,981件の公的なコホートから得られた。
提案したモデルでは精度97.2%、F1スコア97.15%が達成され、先行する個人モデルと比較して大幅に向上した。
論文 参考訳(メタデータ) (2025-05-18T21:46:45Z) - Improved Anomaly Detection through Conditional Latent Space VAE Ensembles [49.1574468325115]
条件付きラテント空間変分オートエンコーダ(CL-VAE)は、既知の不整形クラスと未知の不整形クラスを持つデータに対する異常検出のための前処理を改善した。
モデルでは異常検出の精度が向上し、MNISTデータセットで97.4%のAUCが達成された。
さらに、CL-VAEは、アンサンブルの利点、より解釈可能な潜在空間、モデルサイズに制限のある複雑なデータでパターンを学習する能力の増大を示す。
論文 参考訳(メタデータ) (2024-10-16T07:48:53Z) - Federated Impression for Learning with Distributed Heterogeneous Data [19.50235109938016]
フェデレートラーニング(FL)は、データを共有することなく、クライアント間で分散データセットから学習できるパラダイムを提供する。
FLでは、データ収集プロトコルや患者人口の多様さにより、異なる保健所のデータに準最適収束が一般的である。
我々は,グローバル情報を表す合成データをフェデレーションとして復元することで,破滅的な忘れを緩和するFedImpresを提案する。
論文 参考訳(メタデータ) (2024-09-11T15:37:52Z) - Personalized Federated Learning under Mixture of Distributions [98.25444470990107]
本稿では,ガウス混合モデル(GMM)を用いたPFL(Personalized Federated Learning)を提案する。
FedGMMはオーバーヘッドを最小限に抑え、新しいクライアントに適応する付加的なアドバンテージを持ち、不確実な定量化を可能にします。
PFL分類と新しいサンプル検出の両方において, 合成データセットとベンチマークデータセットの実証評価により, 提案手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-05-01T20:04:46Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。