論文の概要: Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications
- arxiv url: http://arxiv.org/abs/2112.12047v1
- Date: Wed, 22 Dec 2021 17:17:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 16:38:50.502695
- Title: Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications
- Title(参考訳): 人工知的応用のための合成混合型縦型電子健康記録の作成
- Authors: Jin Li, Benjamin J. Cairns, Jingsong Li, Tingting Zhu
- Abstract要約: EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
- 参考スコア(独自算出の注目度): 9.374416143268892
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The recent availability of electronic health records (EHRs) have provided
enormous opportunities to develop artificial intelligence (AI) algorithms.
However, patient privacy has become a major concern that limits data sharing
across hospital settings and subsequently hinders the advances in AI.
\textit{Synthetic data}, which benefits from the development and proliferation
of generative models, has served as a promising substitute for real patient EHR
data. However, the current generative models are limited as they only generate
\textit{single type} of clinical data, i.e., either continuous-valued or
discrete-valued. In this paper, we propose a generative adversarial network
(GAN) entitled EHR-M-GAN which synthesizes \textit{mixed-type} timeseries EHR
data. EHR-M-GAN is capable of capturing the multidimensional, heterogeneous,
and correlated temporal dynamics in patient trajectories. We have validated
EHR-M-GAN on three publicly-available intensive care unit databases with
records from a total of 141,488 unique patients, and performed privacy risk
evaluation of the proposed model. EHR-M-GAN has demonstrated its superiority in
performance over state-of-the-art benchmarks for synthesizing clinical
timeseries with high fidelity. Notably, prediction models for outcomes of
intensive care performed significantly better when training data was augmented
with the addition of EHR-M-GAN-generated timeseries. EHR-M-GAN may have use in
developing AI algorithms in resource-limited settings, lowering the barrier for
data acquisition while preserving patient privacy.
- Abstract(参考訳): 近年の電子健康記録(EHR)は、人工知能(AI)アルゴリズムを開発する大きな機会となった。
しかし、患者のプライバシは、病院設定間でのデータ共有を制限し、その後AIの進歩を妨げる大きな懸念となっている。
生成モデルの発達と増殖の恩恵を受ける「textit{Synthetic data」は、実際の患者EHRデータに代わる有望な代用として機能している。
しかし、現在の生成モデルは、臨床データ(すなわち連続値または離散値のいずれか)の \textit{single type} のみを生成するため、制限されている。
本稿では,EHRデータを合成するEHR-M-GAN(generative adversarial network)を提案する。
EHR-M-GANは、患者軌跡の多次元、異質、相関した時間的ダイナミクスを捉えることができる。
EHR-M-GANは,141,488人のユニークな患者から記録された3つの医療単位データベース上で検証し,提案モデルのプライバシリスク評価を行った。
EHR-M-GANは、高忠実度で臨床時効を合成するための最先端ベンチマークよりも優れた性能を示した。
特に, EHR-M-GANを付加したトレーニングデータでは, 集中治療の結果の予測が有意に改善した。
EHR-M-GANは、リソース制限された設定におけるAIアルゴリズムの開発に使用することができ、患者のプライバシーを維持しながら、データ取得の障壁を低くすることができる。
関連論文リスト
- CEHR-GPT: Generating Electronic Health Records with Chronological
Patient Timelines [12.040682280808863]
我々は合成データ生成に焦点をあて、特定の患者表現を用いてGPTモデルを訓練する能力を実証する。
これにより、観察医療成果パートナーシップ(OMOP)データフォーマットにシームレスに変換できる患者シーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-02-06T20:58:36Z) - Recent Advances in Predictive Modeling with Electronic Health Records [73.31880579203012]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Integrated Convolutional and Recurrent Neural Networks for Health Risk
Prediction using Patient Journey Data with Many Missing Values [9.418011774179794]
本稿では,統合畳み込みニューラルネットワークとリカレントニューラルネットワークを用いたEMH患者旅行データモデリングのためのエンドツーエンドアプローチを提案する。
本モデルでは,各患者旅行における長期的・短期的時間的パターンを抽出し,インパルスデータ生成を伴わずに,高レベルのEHRデータの欠落を効果的に処理することができる。
論文 参考訳(メタデータ) (2022-11-11T07:36:18Z) - Multi-Label Clinical Time-Series Generation via Conditional GAN [23.380183382491495]
MTGAN(Multi-label Time-Series GAN)を用いて,EMHデータと不均衡な疾患を生成する。
批評家はワッサースタイン距離を用いてスコアを与え、データと時間的特徴の両方を考慮することで、合成サンプルから実際のサンプルを認識する。
実験により, MTGANの合成データの品質と実効性を示す。
論文 参考訳(メタデータ) (2022-04-10T23:30:07Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Hide-and-Seek Privacy Challenge [88.49671206936259]
NeurIPS 2020 Hide-and-Seek Privacy Challengeは、両方の問題を解決するための新しい2トラックの競争だ。
我々の頭から頭までのフォーマットでは、新しい高品質な集中ケア時系列データセットを用いて、合成データ生成トラック(「ヒッシャー」)と患者再識別トラック(「シーカー」)の参加者が直接対決する。
論文 参考訳(メタデータ) (2020-07-23T15:50:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。