論文の概要: CEHR-GPT: Generating Electronic Health Records with Chronological
Patient Timelines
- arxiv url: http://arxiv.org/abs/2402.04400v1
- Date: Tue, 6 Feb 2024 20:58:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 17:55:36.932243
- Title: CEHR-GPT: Generating Electronic Health Records with Chronological
Patient Timelines
- Title(参考訳): CEHR-GPT: 患者時系列による電子健康記録の作成
- Authors: Chao Pang, Xinzhuo Jiang, Nishanth Parameshwar Pavinkurve, Krishna S.
Kalluri, Elise L. Minto, Jason Patterson, Linying Zhang, George Hripcsak,
No\'emie Elhadad, Karthik Natarajan
- Abstract要約: 我々は合成データ生成に焦点をあて、特定の患者表現を用いてGPTモデルを訓練する能力を実証する。
これにより、観察医療成果パートナーシップ(OMOP)データフォーマットにシームレスに変換できる患者シーケンスを生成することができる。
- 参考スコア(独自算出の注目度): 12.040682280808863
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic Electronic Health Records (EHR) have emerged as a pivotal tool in
advancing healthcare applications and machine learning models, particularly for
researchers without direct access to healthcare data. Although existing
methods, like rule-based approaches and generative adversarial networks (GANs),
generate synthetic data that resembles real-world EHR data, these methods often
use a tabular format, disregarding temporal dependencies in patient histories
and limiting data replication. Recently, there has been a growing interest in
leveraging Generative Pre-trained Transformers (GPT) for EHR data. This enables
applications like disease progression analysis, population estimation,
counterfactual reasoning, and synthetic data generation. In this work, we focus
on synthetic data generation and demonstrate the capability of training a GPT
model using a particular patient representation derived from CEHR-BERT,
enabling us to generate patient sequences that can be seamlessly converted to
the Observational Medical Outcomes Partnership (OMOP) data format.
- Abstract(参考訳): 合成電子健康記録(ehr)は、医療アプリケーションや機械学習モデル、特に医療データに直接アクセスしない研究者にとって、重要なツールとして登場した。
ルールベースのアプローチやGAN(Generative Adversarial Network)のような既存の手法は、現実のEHRデータに似た合成データを生成するが、これらの手法はしばしば表形式を使用し、患者の履歴の時間的依存関係を無視し、データの複製を制限する。
近年、EHRデータにGPT(Generative Pre-trained Transformer)を活用することへの関心が高まっている。
これにより、疾患の進行分析、人口推定、反事実推論、合成データ生成などのアプリケーションが可能になる。
本研究では,合成データ生成に着目し,cehr-bert由来の特定の患者表現を用いてgptモデルを訓練する能力を示し,観察的医療成果連携(omop)データ形式にシームレスに変換可能な患者シーケンスを生成する。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Guided Discrete Diffusion for Electronic Health Record Generation [47.129056768385084]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。
幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。
これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文 参考訳(メタデータ) (2024-04-18T16:50:46Z) - Recent Advances in Predictive Modeling with Electronic Health Records [71.19967863320647]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Leveraging Generative AI Models for Synthetic Data Generation in
Healthcare: Balancing Research and Privacy [0.0]
GANやVAEといった生成AIモデルは、貴重なデータアクセスと患者のプライバシ保護のバランスをとるための、有望なソリューションを提供する。
本稿では,現実的な匿名化された患者データを作成するための生成AIモデルについて検討する。
論文 参考訳(メタデータ) (2023-05-09T08:12:44Z) - Multi-Label Clinical Time-Series Generation via Conditional GAN [23.380183382491495]
MTGAN(Multi-label Time-Series GAN)を用いて,EMHデータと不均衡な疾患を生成する。
批評家はワッサースタイン距離を用いてスコアを与え、データと時間的特徴の両方を考慮することで、合成サンプルから実際のサンプルを認識する。
実験により, MTGANの合成データの品質と実効性を示す。
論文 参考訳(メタデータ) (2022-04-10T23:30:07Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。