論文の概要: Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications
- arxiv url: http://arxiv.org/abs/2112.12047v1
- Date: Wed, 22 Dec 2021 17:17:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 16:38:50.502695
- Title: Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications
- Title(参考訳): 人工知的応用のための合成混合型縦型電子健康記録の作成
- Authors: Jin Li, Benjamin J. Cairns, Jingsong Li, Tingting Zhu
- Abstract要約: EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
- 参考スコア(独自算出の注目度): 9.374416143268892
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The recent availability of electronic health records (EHRs) have provided
enormous opportunities to develop artificial intelligence (AI) algorithms.
However, patient privacy has become a major concern that limits data sharing
across hospital settings and subsequently hinders the advances in AI.
\textit{Synthetic data}, which benefits from the development and proliferation
of generative models, has served as a promising substitute for real patient EHR
data. However, the current generative models are limited as they only generate
\textit{single type} of clinical data, i.e., either continuous-valued or
discrete-valued. In this paper, we propose a generative adversarial network
(GAN) entitled EHR-M-GAN which synthesizes \textit{mixed-type} timeseries EHR
data. EHR-M-GAN is capable of capturing the multidimensional, heterogeneous,
and correlated temporal dynamics in patient trajectories. We have validated
EHR-M-GAN on three publicly-available intensive care unit databases with
records from a total of 141,488 unique patients, and performed privacy risk
evaluation of the proposed model. EHR-M-GAN has demonstrated its superiority in
performance over state-of-the-art benchmarks for synthesizing clinical
timeseries with high fidelity. Notably, prediction models for outcomes of
intensive care performed significantly better when training data was augmented
with the addition of EHR-M-GAN-generated timeseries. EHR-M-GAN may have use in
developing AI algorithms in resource-limited settings, lowering the barrier for
data acquisition while preserving patient privacy.
- Abstract(参考訳): 近年の電子健康記録(EHR)は、人工知能(AI)アルゴリズムを開発する大きな機会となった。
しかし、患者のプライバシは、病院設定間でのデータ共有を制限し、その後AIの進歩を妨げる大きな懸念となっている。
生成モデルの発達と増殖の恩恵を受ける「textit{Synthetic data」は、実際の患者EHRデータに代わる有望な代用として機能している。
しかし、現在の生成モデルは、臨床データ(すなわち連続値または離散値のいずれか)の \textit{single type} のみを生成するため、制限されている。
本稿では,EHRデータを合成するEHR-M-GAN(generative adversarial network)を提案する。
EHR-M-GANは、患者軌跡の多次元、異質、相関した時間的ダイナミクスを捉えることができる。
EHR-M-GANは,141,488人のユニークな患者から記録された3つの医療単位データベース上で検証し,提案モデルのプライバシリスク評価を行った。
EHR-M-GANは、高忠実度で臨床時効を合成するための最先端ベンチマークよりも優れた性能を示した。
特に, EHR-M-GANを付加したトレーニングデータでは, 集中治療の結果の予測が有意に改善した。
EHR-M-GANは、リソース制限された設定におけるAIアルゴリズムの開発に使用することができ、患者のプライバシーを維持しながら、データ取得の障壁を低くすることができる。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Guided Discrete Diffusion for Electronic Health Record Generation [47.129056768385084]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。
幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。
これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文 参考訳(メタデータ) (2024-04-18T16:50:46Z) - CEHR-GPT: Generating Electronic Health Records with Chronological Patient Timelines [14.386260536090628]
我々は合成データ生成に焦点をあて、特定の患者表現を用いてGPTモデルを訓練する能力を実証する。
これにより、観察医療成果パートナーシップ(OMOP)データフォーマットにシームレスに変換できる患者シーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-02-06T20:58:36Z) - Recent Advances in Predictive Modeling with Electronic Health Records [71.19967863320647]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Multi-Label Clinical Time-Series Generation via Conditional GAN [23.380183382491495]
MTGAN(Multi-label Time-Series GAN)を用いて,EMHデータと不均衡な疾患を生成する。
批評家はワッサースタイン距離を用いてスコアを与え、データと時間的特徴の両方を考慮することで、合成サンプルから実際のサンプルを認識する。
実験により, MTGANの合成データの品質と実効性を示す。
論文 参考訳(メタデータ) (2022-04-10T23:30:07Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。