論文の概要: CEHR-XGPT: A Scalable Multi-Task Foundation Model for Electronic Health Records
- arxiv url: http://arxiv.org/abs/2509.03643v2
- Date: Fri, 05 Sep 2025 12:40:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 12:28:42.588095
- Title: CEHR-XGPT: A Scalable Multi-Task Foundation Model for Electronic Health Records
- Title(参考訳): CEHR-XGPT:電子健康記録のためのスケーラブルなマルチタスク基盤モデル
- Authors: Chao Pang, Jiheum Park, Xinzhuo Jiang, Nishanth Parameshwar Pavinkurve, Krishna S. Kalluri, Shalmali Joshi, Noémie Elhadad, Karthik Natarajan,
- Abstract要約: CEHR-XGPTは、ERHRデータの汎用基盤モデルである。
特徴表現、ゼロショット予測、合成データ生成の3つの重要な機能を統合する。
3つのタスクすべてに対して強力なパフォーマンスを示し、外部データセットに効果的に一般化する。
- 参考スコア(独自算出の注目度): 9.583050730170557
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electronic Health Records (EHRs) provide a rich, longitudinal view of patient health and hold significant potential for advancing clinical decision support, risk prediction, and data-driven healthcare research. However, most artificial intelligence (AI) models for EHRs are designed for narrow, single-purpose tasks, limiting their generalizability and utility in real-world settings. Here, we present CEHR-XGPT, a general-purpose foundation model for EHR data that unifies three essential capabilities - feature representation, zero-shot prediction, and synthetic data generation - within a single architecture. To support temporal reasoning over clinical sequences, CEHR-XGPT incorporates a novel time-token-based learning framework that explicitly encodes patients' dynamic timelines into the model structure. CEHR-XGPT demonstrates strong performance across all three tasks and generalizes effectively to external datasets through vocabulary expansion and fine-tuning. Its versatility enables rapid model development, cohort discovery, and patient outcome forecasting without the need for task-specific retraining.
- Abstract(参考訳): 電子健康記録(Electronic Health Records, EHRs)は、患者の健康を豊かかつ経時的に把握し、臨床決定支援、リスク予測、データ駆動型医療研究を前進させる重要な可能性を秘めている。
しかしながら、ほとんどの人工知能(AI)モデルは狭い単一目的のタスクのために設計されており、現実の環境での汎用性と有用性を制限している。
本稿では,EHRデータのための汎用基盤モデルであるCEHR-XGPTについて述べる。
CEHR-XGPTは、患者の動的タイムラインをモデル構造に明示的にエンコードする、新しいタイムトケンベースの学習フレームワークを組み込んだ。
CEHR-XGPTは3つのタスクすべてに対して強力なパフォーマンスを示し、語彙展開と微調整によって外部データセットに効果的に一般化する。
その汎用性は、タスク固有の再トレーニングを必要とせずに、迅速なモデル開発、コホート発見、および患者の結果予測を可能にする。
関連論文リスト
- Time-Aware Attention for Enhanced Electronic Health Records Modeling [8.4225455796455]
TALE-EHR は Transformer ベースのフレームワークで,連続的な時間的ギャップを明示的にモデル化する,新たなタイムアウェアアテンション機構を備えている。
本手法は, 疾患進展予測などのタスクにおいて, 最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-07-20T07:32:41Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - EHRMamba: Towards Generalizable and Scalable Foundation Models for Electronic Health Records [4.540391547020466]
我々は,Mambaアーキテクチャ上に構築された堅牢な基盤モデルであるEHRMambaを紹介する。
EHRデータに対するMPF(Multitask Prompted Finetuning)の新たなアプローチを導入し,EHRMambaが単一ファインタニングフェーズで複数の臨床タスクを同時に学習できるようにする。
MIMIC-IVデータセットを用いて評価したところ, EHRMambaは6つの主要な臨床課題にまたがって最先端の成績を向上し, EHR予測に優れており, この分野における飛躍的な進歩を示している。
論文 参考訳(メタデータ) (2024-05-23T13:43:29Z) - Recent Advances in Predictive Modeling with Electronic Health Records [71.19967863320647]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。