論文の概要: A Comparative Benchmark of Federated Learning Strategies for Mortality Prediction on Heterogeneous and Imbalanced Clinical Data
- arxiv url: http://arxiv.org/abs/2509.10517v1
- Date: Wed, 03 Sep 2025 11:32:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-21 06:05:45.775448
- Title: A Comparative Benchmark of Federated Learning Strategies for Mortality Prediction on Heterogeneous and Imbalanced Clinical Data
- Title(参考訳): 不均一および不均衡な臨床データにおける死亡予測のためのフェデレーション学習手法の比較ベンチマーク
- Authors: Rodrigo Tertulino,
- Abstract要約: フェデレートラーニング(FL)は、プライバシ保護ソリューションを提供するが、その非独立性とIdentically Distributed(非IID)と不均衡な条件下でのパフォーマンスには調査が必要である。
本研究では,FedAvg,FedProx,FedAdagrad,FedAdam,FedClusterの5つのフェデレーション学習戦略の比較ベンチマークを行った。
この結果から,FedProxのような正規化に基づくFLアルゴリズムは,不均一かつ不均衡な臨床予測タスクに対して,より堅牢で効果的なソリューションを提供することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning models hold significant potential for predicting in-hospital mortality, yet data privacy constraints and the statistical heterogeneity of real-world clinical data often hamper their development. Federated Learning (FL) offers a privacy-preserving solution, but its performance under non-Independent and Identically Distributed (non-IID) and imbalanced conditions requires rigorous investigation. The study presents a comparative benchmark of five federated learning strategies: FedAvg, FedProx, FedAdagrad, FedAdam, and FedCluster for mortality prediction. Using the large-scale MIMIC-IV dataset, we simulate a realistic non-IID environment by partitioning data by clinical care unit. To address the inherent class imbalance of the task, the SMOTE-Tomek technique is applied to each client's local training data. Our experiments, conducted over 50 communication rounds, reveal that the regularization-based strategy, FedProx, consistently outperformed other methods, achieving the highest F1-Score of 0.8831 while maintaining stable convergence. While the baseline FedAvg was the most computationally efficient, its predictive performance was substantially lower. Our findings indicate that regularization-based FL algorithms like FedProx offer a more robust and effective solution for heterogeneous and imbalanced clinical prediction tasks than standard or server-side adaptive aggregation methods. The work provides a crucial empirical benchmark for selecting appropriate FL strategies for real-world healthcare applications.
- Abstract(参考訳): 機械学習モデルは、病院内での死亡を予測できる重要な可能性を秘めているが、データプライバシーの制約と実際の臨床データの統計的不均一性は、しばしば開発を妨げている。
フェデレートラーニング(FL)は、プライバシ保護ソリューションを提供するが、その非独立性とIdentically Distributed(非IID)と不均衡な条件下でのパフォーマンスには厳密な調査が必要である。
この研究は、フェデレーション予測のためのFedAvg、FedProx、FedAdagrad、FedAdam、FedClusterの5つのフェデレーション学習戦略の比較ベンチマークを示す。
大規模MIMIC-IVデータセットを用いて,臨床医療ユニットによるデータ分割により,現実的な非IID環境をシミュレートする。
タスク固有のクラス不均衡に対処するため、各クライアントのローカルトレーニングデータにSMOTE-Tomek技術を適用する。
また,50回以上の通信ラウンドを行った結果,規則化戦略であるFedProxは,安定収束を維持しつつ,最高F1スコア0.8831を達成した。
ベースラインであるFedAvgは計算効率が最も高かったが、予測性能は著しく低かった。
この結果から,FedProxのような正規化に基づくFLアルゴリズムは,標準あるいはサーバ側適応アダプティブアグリゲーション法よりも,不均一かつ不均衡な臨床予測タスクに対して,より堅牢で効果的なソリューションを提供することがわかった。
この研究は、現実世界の医療アプリケーションに適切なFL戦略を選択するための重要な経験的ベンチマークを提供する。
関連論文リスト
- A Robust Pipeline for Differentially Private Federated Learning on Imbalanced Clinical Data using SMOTETomek and FedProx [0.0]
Federated Learning (FL)は、共同健康研究のための画期的なアプローチである。
FLは、差分プライバシー(DP)と組み合わせて正式なセキュリティ保証を提供する
プライバシーユーティリティフロンティアで最適な運用領域が特定された。
論文 参考訳(メタデータ) (2025-08-06T20:47:50Z) - Toward Fair Federated Learning under Demographic Disparities and Data Imbalance [8.444310568786408]
フェデレートラーニング(Federated Learning, FL)は、機関間のプライバシー保護コラボレーションを可能にする。
フェアネスを意識した正規化とグループ条件オーバサンプリングを組み合わせたフレームワークに依存しないFedIDAを提案する。
FedIDAは、競争力のある予測性能を維持しながら、常に公正性を向上することを示す。
論文 参考訳(メタデータ) (2025-05-14T11:22:54Z) - Revisit the Stability of Vanilla Federated Learning Under Diverse Conditions [3.237380113935023]
Federated Learning(FL)は分散機械学習のパラダイムであり、分散化されたクライアント間で協調的なモデルトレーニングを可能にする。
種々の条件下でのバニラFedAvgアルゴリズムの安定性を再検討する。
論文 参考訳(メタデータ) (2025-02-27T07:47:59Z) - FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - On the Impact of Data Heterogeneity in Federated Learning Environments with Application to Healthcare Networks [3.9058850780464884]
Federated Learning(FL)は、プライバシに敏感なアプリケーションが、情報を開示することなく、グローバルモデル構築のためにデータセットを活用することを可能にする。
これらの領域の1つは医療であり、サイロのグループは、精度と一般化を改善したグローバルな予測器を生成するために協力する。
本稿では,医学データの複雑さに着目し,FL環境における不均一性の数学的形式化と分類を包括的に調査する。
論文 参考訳(メタデータ) (2024-04-29T09:05:01Z) - FedSkip: Combatting Statistical Heterogeneity with Federated Skip
Aggregation [95.85026305874824]
我々はFedSkipと呼ばれるデータ駆動型アプローチを導入し、フェデレーション平均化を定期的にスキップし、ローカルモデルをクロスデバイスに分散することで、クライアントの最適化を改善する。
我々は、FedSkipがはるかに高い精度、より良いアグリゲーション効率、競合する通信効率を達成することを示すために、さまざまなデータセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2022-12-14T13:57:01Z) - Label-Efficient Self-Supervised Federated Learning for Tackling Data
Heterogeneity in Medical Imaging [23.08596805950814]
医用画像解析のための頑健でラベル効率の良い自己教師型FLフレームワークを提案する。
具体的には,既存のFLパイプラインに分散自己教師型事前学習パラダイムを導入する。
自己教師付きFLアルゴリズムは,分布外データに対してよく一般化し,限定ラベルのシナリオにおいてより効果的にフェデレーションモデルを学習することを示す。
論文 参考訳(メタデータ) (2022-05-17T18:33:43Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - Local Learning Matters: Rethinking Data Heterogeneity in Federated
Learning [61.488646649045215]
フェデレートラーニング(FL)は、クライアントのネットワーク(エッジデバイス)でプライバシ保護、分散ラーニングを行うための有望な戦略である。
論文 参考訳(メタデータ) (2021-11-28T19:03:39Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。