論文の概要: Federated Timeline Synthesis: Scalable and Private Methodology For Model Training and Deployment
- arxiv url: http://arxiv.org/abs/2506.23358v1
- Date: Sun, 29 Jun 2025 18:29:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.846285
- Title: Federated Timeline Synthesis: Scalable and Private Methodology For Model Training and Deployment
- Title(参考訳): Federated Timeline Synthesis: モデルトレーニングとデプロイのためのスケーラブルでプライベートな方法論
- Authors: Pawel Renc, Michal K. Grzeszczyk, Linglong Qian, Nassim Oufattole, Jeff Rasley, Arkadiusz Sitek,
- Abstract要約: Federated Timeline Synthesis (FTS)は、分散時系列データ間で生成基盤モデルをトレーニングするためのフレームワークである。
FTSは、患者履歴をトークン化された患者健康タイムライン(PHTs)として表現する
MIMIC-IVデータを用いた5つの臨床的意義のある予測課題におけるFTSの評価を行った。
- 参考スコア(独自算出の注目度): 2.171982889010269
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Federated Timeline Synthesis (FTS), a novel framework for training generative foundation models across distributed timeseries data applied to electronic health records (EHR). At its core, FTS represents patient history as tokenized Patient Health Timelines (PHTs), language-agnostic sequences encoding temporal, categorical, and continuous clinical information. Each institution trains an autoregressive transformer on its local PHTs and transmits only model weights to a central server. The server uses the generators to synthesize a large corpus of trajectories and train a Global Generator (GG), enabling zero-shot inference via Monte Carlo simulation of future PHTs. We evaluate FTS on five clinically meaningful prediction tasks using MIMIC-IV data, showing that models trained on synthetic data generated by GG perform comparably to those trained on real data. FTS offers strong privacy guarantees, scalability across institutions, and extensibility to diverse prediction and simulation tasks especially in healthcare, including counterfactual inference, early warning detection, and synthetic trial design.
- Abstract(参考訳): 本稿では,電子健康記録(EHR)に適用した分散時系列データ間で生成基盤モデルをトレーニングするための新しいフレームワークであるフェデレートタイムライン合成(FTS)を提案する。
FTSは、患者の歴史を、時間的、分類的、連続的な臨床情報をコードする言語に依存しない、トークン化された患者健康タイムライン(PHT)として表現している。
各機関は、ローカルPHT上で自己回帰変換器を訓練し、モデルウェイトのみを中央サーバに送信する。
サーバはジェネレータを使用して、大量のトラジェクトリを合成し、グローバルジェネレータ(GG)を訓練し、将来のPHTのモンテカルロシミュレーションによるゼロショット推論を可能にする。
我々は,MIMIC-IVデータを用いた5つの臨床的有意な予測課題についてFTSを評価し,GGが生成した合成データに基づいてトレーニングしたモデルが実データでトレーニングしたモデルと同等に機能することを示した。
FTSは、強力なプライバシー保証、機関間のスケーラビリティ、特に医療における様々な予測とシミュレーションタスクの拡張性を提供する。
関連論文リスト
- CAAT-EHR: Cross-Attentional Autoregressive Transformer for Multimodal Electronic Health Record Embeddings [0.0]
本稿では,タスク非依存の縦埋め込みを生のEHRデータから生成する新しいアーキテクチャであるCAAT-EHRを紹介する。
自己回帰デコーダは、事前訓練中に将来の時刻データを予測してエンコーダを補完し、その結果の埋め込みが時間的整合性と整合性を維持する。
論文 参考訳(メタデータ) (2025-01-31T05:00:02Z) - Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - TEE4EHR: Transformer Event Encoder for Better Representation Learning in
Electronic Health Records [4.385313487148474]
電子健康記録(EHR)における時系列の非規則サンプリングは、機械学習モデルを開発する上での大きな課題の1つである。
本稿では,EHRにおける実験結果のパターンを符号化する点過程損失を有する変圧器イベントエンコーダ(TEE)を提案する。
自己教師付き学習アプローチでは、TEEは既存の注目ベースのディープニューラルネットワークと共同で学習される。
論文 参考訳(メタデータ) (2024-02-09T12:19:06Z) - CEHR-GPT: Generating Electronic Health Records with Chronological Patient Timelines [14.386260536090628]
我々は合成データ生成に焦点をあて、特定の患者表現を用いてGPTモデルを訓練する能力を実証する。
これにより、観察医療成果パートナーシップ(OMOP)データフォーマットにシームレスに変換できる患者シーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-02-06T20:58:36Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Online Evolutionary Neural Architecture Search for Multivariate
Non-Stationary Time Series Forecasting [72.89994745876086]
本研究は、オンラインニューロ進化に基づくニューラルアーキテクチャサーチ(ONE-NAS)アルゴリズムを提案する。
ONE-NASは、オンライン予測タスクのためにリカレントニューラルネットワーク(RNN)を自動設計し、動的にトレーニングする新しいニューラルネットワーク探索手法である。
その結果、ONE-NASは従来の統計時系列予測法よりも優れていた。
論文 参考訳(メタデータ) (2023-02-20T22:25:47Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。