論文の概要: FedEHR-Gen: Federated Synthetic Time-Series EHR Generation via Latent Space Alignment and Distribution-Aware Aggregation
- arxiv url: http://arxiv.org/abs/2605.27892v1
- Date: Wed, 27 May 2026 03:17:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.707514
- Title: FedEHR-Gen: Federated Synthetic Time-Series EHR Generation via Latent Space Alignment and Distribution-Aware Aggregation
- Title(参考訳): FedEHR-Gen: 潜在空間アライメントと分布認識アグリゲーションによるフェデレーション合成時系列EHR生成
- Authors: Jun Bai, Ziyang Song, Yue Li,
- Abstract要約: FedEHR-Genは、分散病院にまたがる時系列EHR生成のための最初の連合フレームワークである。
病院間のセマンティックな整合性を確保するため,局所エンコーダをグローバルな潜在空間に整合させる階層的整合性アグリゲーション機構を開発した。
eICUとMIMIC-IIIデータセットの実験は、FedEHR-Genが、集中的なトレーニングに匹敵する世代知性、下流ユーティリティ、プライバシリスクを達成することを示した。
- 参考スコア(独自算出の注目度): 15.339846262498396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetic Electronic Health Record (EHR) generation provides a promising avenue for data augmentation and cross-hospital modeling in privacy-constrained healthcare settings. However, most existing EHR generative models are centralized and require pooling data across hospitals, which is often infeasible when real-world data sharing is restricted. While federated EHR generation offers a natural solution, direct federated modeling often collapses or diverges due to the high dimensionality, sparsity, and cross-hospital heterogeneity of EHR data. In this work, we propose FedEHR-Gen, the first federated framework for synthetic time-series EHR generation across distributed hospitals. FedEHR-Gen uses a two-stage learning paradigm. First, we introduce a federated autoencoder that projects high-dimensional and sparse EHR features onto a compact latent space. To ensure semantic consistency across hospitals, we develop a layer-wise matching aggregation mechanism that aligns local encoders into a unified global latent space. Second, operating on this aligned latent space, we train a federated temporal conditional variational autoencoder (TCVAE) with distribution-aware aggregation, enabling stable temporal generative modeling under severe cross-hospital heterogeneity. Extensive experiments on the eICU and MIMIC-III datasets demonstrate that FedEHR-Gen achieves generation fidelity, downstream utility, and privacy risk comparable to centralized training, while consistently outperforming the standard federated baseline.
- Abstract(参考訳): Synthetic Electronic Health Record(EHR)生成は、プライバシに制約された医療設定において、データ拡張とクロスホスピタルモデリングのための有望な道を提供する。
しかしながら、既存の EHR 生成モデルのほとんどは中央集権的であり、実際のデータ共有が制限された場合、しばしば無効となる病院間でデータをプールする必要がある。
連合型EHR生成は自然解を提供するが、直接連合型モデリングは高次元性、疎性、EHRデータのクロスホスピタル不均一性のためにしばしば崩壊または分岐する。
本研究は,分散病院における時系列EHR生成のための第1回フェデレーションフレームワークであるFedEHR-Genを提案する。
FedEHR-Genは2段階の学習パラダイムを使用している。
まず,高次元かつスパースなEHR特徴をコンパクトな潜在空間に投影するフェデレートオートエンコーダを提案する。
病院間のセマンティックな整合性を確保するため,局所エンコーダをグローバルな潜在空間に整合させる階層的整合性アグリゲーション機構を開発した。
第2に、この整列型潜伏空間上で動作し、配向型時間条件変分オートエンコーダ(TCVAE)を訓練し、重度熱間不均一性の下で安定した時間的生成モデリングを可能にする。
eICUとMIMIC-IIIデータセットの大規模な実験により、FedEHR-Genは、標準のフェデレーションベースラインを一貫して上回りながら、中央集権トレーニングに匹敵する世代忠実さ、ダウンストリームユーティリティ、プライバシリスクを達成することが示された。
関連論文リスト
- CDMT-EHR: A Continuous-Time Diffusion Framework for Generating Mixed-Type Time-Series Electronic Health Records [4.150685955410148]
混合型時間サンプリング EHR を生成するための連続時間拡散フレームワークを提案する。
提案手法は,ダウンストリームタスク性能,分散忠実度,識別可能性において,既存の手法よりも優れる。
論文 参考訳(メタデータ) (2026-03-24T21:09:04Z) - A Reinforcement Learning Approach to Synthetic Data Generation [8.293402602656736]
RLSynは患者記録に対するポリシーとしてデータジェネレータをモデル化する新しいフレームワークである。
我々は、プライバシー、実用性、忠実度を評価する上で、最先端のジェネレーティブ・敵ネットワーク(GAN)と拡散に基づく手法を比較検討した。
論文 参考訳(メタデータ) (2025-12-24T19:26:37Z) - Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。
このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。
このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文 参考訳(メタデータ) (2025-10-24T15:56:40Z) - High-Fidelity Synthetic ECG Generation via Mel-Spectrogram Informed Diffusion Training [3.864395218585964]
リアル患者心電図(ECG)データの共有に関するプライバシー制限により、心臓ケアのための機械学習の開発が妨げられる。
本研究は、現在の生成ECG法における2つの大きな欠点に対処する。
条件付き拡散に基づく構造化状態空間モデル (Structured State Space Model, SSSD-ECG) を2つの原則により構築する。
論文 参考訳(メタデータ) (2025-10-07T01:14:53Z) - Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。