論文の概要: Federated Proximal Optimization for Privacy-Preserving Heart Disease Prediction: A Controlled Simulation Study on Non-IID Clinical Data
- arxiv url: http://arxiv.org/abs/2601.17183v1
- Date: Fri, 23 Jan 2026 21:18:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.393697
- Title: Federated Proximal Optimization for Privacy-Preserving Heart Disease Prediction: A Controlled Simulation Study on Non-IID Clinical Data
- Title(参考訳): プライバシ保存型心疾患予測のためのフェデレーション近位最適化:非IID臨床データの制御シミュレーションによる研究
- Authors: Farzam Asad, Junaid Saif Khan, Maria Tariq, Sundus Munir, Muhammad Adnan Khan,
- Abstract要約: 本稿では,UCI心疾患データセットに基づく心疾患予測のためのフェデレーション・プロキシ・オプティマイズ(FedProx)の総合シミュレーション研究について述べる。
我々はクリーブランドクリニックの4つの異種病院クライアントをシミュレートすることにより,現実的な非IIDデータ分割を生成する。
我々の結果は病院IT管理者に直接転送可能であり、プライバシー保護協調学習を実装しています。
- 参考スコア(独自算出の注目度): 1.620240963217448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Healthcare institutions have access to valuable patient data that could be of great help in the development of improved diagnostic models, but privacy regulations like HIPAA and GDPR prevent hospitals from directly sharing data with one another. Federated Learning offers a way out to this problem by facilitating collaborative model training without having the raw patient data centralized. However, clinical datasets intrinsically have non-IID (non-independent and identically distributed) features brought about by demographic disparity and diversity in disease prevalence and institutional practices. This paper presents a comprehensive simulation research of Federated Proximal Optimization (FedProx) for Heart Disease prediction based on UCI Heart Disease dataset. We generate realistic non-IID data partitions by simulating four heterogeneous hospital clients from the Cleveland Clinic dataset (303 patients), by inducing statistical heterogeneity by demographic-based stratification. Our experimental results show that FedProx with proximal parameter mu=0.05 achieves 85.00% accuracy, which is better than both centralized learning (83.33%) and isolated local models (78.45% average) without revealing patient privacy. Through generous sheer ablation studies with statistical validation on 50 independent runs we demonstrate that proximal regularization is effective in curbing client drift in heterogeneous environments. This proof-of-concept research offers algorithmic insights and practical deployment guidelines for real-world federated healthcare systems, and thus, our results are directly transferable to hospital IT-administrators, implementing privacy-preserving collaborative learning.
- Abstract(参考訳): 医療機関は、診断モデルの改善に大いに役立つ貴重な患者データにアクセスできますが、HIPAAやGDPRといったプライバシー規制は、病院が直接データを共有できないようにします。
フェデレートラーニング(Federated Learning)は、患者データを集中管理することなく、協調的なモデルトレーニングを促進することで、この問題に対処する手段を提供する。
しかし、臨床データセットは本質的に非IID(非独立で同一に分布する)の特徴を持ち、人口的格差や病気の有病率の多様性、制度的な実践によって引き起こされる。
本稿では,UCI心疾患データセットに基づく心疾患予測のためのフェデレーション・プロキシ・オプティマイズ(FedProx)の総合シミュレーション研究について述べる。
人口統計学的階層化により統計的不均一性を誘導し,クリーブランドクリニックデータセット(303例)から4つの異種病院クライアントをシミュレートすることにより,現実的な非IIDデータ分割を生成する。
実験の結果,近位パラメータmu=0.05のFedProxの精度は85.00%であり,集中学習(83.33%)と孤立局所モデル(78.45%)のどちらよりも,患者のプライバシを明らかにしない。
本研究は,50個の独立ランニングに対する統計的検証を伴う遺伝的せん断アブレーション研究を通じて,不均一環境におけるクライアントドリフト抑制に近位正則化が有効であることを示す。
この概念実証研究は、現実の医療システムに対するアルゴリズム的な洞察と実践的な展開ガイドラインを提供しており、当社の成果は、プライバシ保護協調学習を実装した病院IT管理者に直接転送可能である。
関連論文リスト
- Federated Learning for Pediatric Pneumonia Detection: Enabling Collaborative Diagnosis Without Sharing Patient Data [0.20878272814614088]
胸部X線による早期かつ正確な肺炎検出は、治療と隔離の迅速化、合併症の軽減、不要な抗生物質使用の抑制に臨床的に重要である。
CXRベースの検出の開発は、グローバルな分散データ、高いホスピタル間変動、厳格なプライバシー規制によって妨げられている。
本稿では,Sherpa.ai FLプラットフォームを用いて,フェデレートラーニング(FL)の評価を行う。
FLは、ハイパフォーマンスで、一般化可能で、安全で、プライベートな肺炎検出を、医療ネットワーク全体にわたって提供する。
論文 参考訳(メタデータ) (2025-11-12T18:17:06Z) - A Robust Pipeline for Differentially Private Federated Learning on Imbalanced Clinical Data using SMOTETomek and FedProx [0.0]
Federated Learning (FL)は、共同健康研究のための画期的なアプローチである。
FLは、差分プライバシー(DP)と組み合わせて正式なセキュリティ保証を提供する
プライバシーユーティリティフロンティアで最適な運用領域が特定された。
論文 参考訳(メタデータ) (2025-08-06T20:47:50Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Addressing Data Heterogeneity in Federated Learning of Cox Proportional Hazards Models [8.798959872821962]
本稿では,フェデレーションサバイバル分析の分野,特にCox Proportional Hazards(CoxPH)モデルについて概説する。
本稿では,合成データセットと実世界のアプリケーション間のモデル精度を向上させるために,特徴ベースのクラスタリングを用いたFLアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-20T18:34:20Z) - Differentially Private Distributed Inference [2.4401219403555814]
臨床試験に協力する医療センターは、知識共有と機密データ保護のバランスを取る必要がある。
情報漏洩を制御するために差分プライバシー(DP)を用いてこの問題に対処する。
エージェントはログリニアルールを通じて信条統計を更新し、DPノイズは信頼性の高い識別性と厳格な性能保証を提供する。
論文 参考訳(メタデータ) (2024-02-13T01:38:01Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。