論文の概要: Multi-Label Clinical Time-Series Generation via Conditional GAN
- arxiv url: http://arxiv.org/abs/2204.04797v2
- Date: Thu, 31 Aug 2023 22:16:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-04 17:39:37.796966
- Title: Multi-Label Clinical Time-Series Generation via Conditional GAN
- Title(参考訳): 条件付きGANによるマルチラベル臨床時系列生成
- Authors: Chang Lu, Chandan K. Reddy, Ping Wang, Dong Nie, Yue Ning
- Abstract要約: MTGAN(Multi-label Time-Series GAN)を用いて,EMHデータと不均衡な疾患を生成する。
批評家はワッサースタイン距離を用いてスコアを与え、データと時間的特徴の両方を考慮することで、合成サンプルから実際のサンプルを認識する。
実験により, MTGANの合成データの品質と実効性を示す。
- 参考スコア(独自算出の注目度): 23.380183382491495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, deep learning has been successfully adopted in a wide range
of applications related to electronic health records (EHRs) such as
representation learning and clinical event prediction. However, due to privacy
constraints, limited access to EHR becomes a bottleneck for deep learning
research. To mitigate these concerns, generative adversarial networks (GANs)
have been successfully used for generating EHR data. However, there are still
challenges in high-quality EHR generation, including generating time-series EHR
data and imbalanced uncommon diseases. In this work, we propose a Multi-label
Time-series GAN (MTGAN) to generate EHR and simultaneously improve the quality
of uncommon disease generation. The generator of MTGAN uses a gated recurrent
unit (GRU) with a smooth conditional matrix to generate sequences and uncommon
diseases. The critic gives scores using Wasserstein distance to recognize real
samples from synthetic samples by considering both data and temporal features.
We also propose a training strategy to calculate temporal features for real
data and stabilize GAN training. Furthermore, we design multiple statistical
metrics and prediction tasks to evaluate the generated data. Experimental
results demonstrate the quality of the synthetic data and the effectiveness of
MTGAN in generating realistic sequential EHR data, especially for uncommon
diseases.
- Abstract(参考訳): 近年,表現学習や臨床事象予測といった電子健康記録(ehrs)に関する幅広い応用において,ディープラーニングが成功している。
しかし、プライバシーの制約により、EHRへのアクセス制限はディープラーニング研究のボトルネックとなっている。
これらの懸念を軽減するため、GAN(Generative Adversarial Network)はEHRデータの生成に成功している。
しかしながら、時系列のEHRデータの生成や不均衡な疾患など、高品質なEHR生成には依然として課題がある。
本研究では, MTGAN (Multi-label Time-Series GAN) を用いて, EHR の生成と非一般的な疾患発生の質の向上を図る。
MTGANのジェネレータは、スムーズな条件行列を持つゲートリカレントユニット(GRU)を使用して、配列と異常な疾患を生成する。
批評家はワッサースタイン距離を用いてスコアを与え、データと時間的特徴の両方を考慮して合成サンプルから実際のサンプルを認識する。
また,実データに対する時間的特徴を算出し,gan学習を安定させるトレーニング戦略を提案する。
さらに,複数の統計指標と予測タスクを設計し,生成されたデータを評価する。
実験結果から, MTGANの生合成データの品質と, 現実的なシーケンシャルEHRデータ生成効果, 特に非一般的な疾患に対する有効性が確認された。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Guided Discrete Diffusion for Electronic Health Record Generation [47.129056768385084]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。
幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。
これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文 参考訳(メタデータ) (2024-04-18T16:50:46Z) - CEHR-GPT: Generating Electronic Health Records with Chronological Patient Timelines [14.386260536090628]
我々は合成データ生成に焦点をあて、特定の患者表現を用いてGPTモデルを訓練する能力を実証する。
これにより、観察医療成果パートナーシップ(OMOP)データフォーマットにシームレスに変換できる患者シーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-02-06T20:58:36Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Cumulative Stay-time Representation for Electronic Health Records in
Medical Event Time Prediction [8.261597797345342]
累積滞留時間表現(CTR)と呼ばれる新しいEMHデータ表現を提案する。
CTRはそのような累積的な健康状態を直接モデル化する。
我々は、ターゲットデータに適合する柔軟性を持つニューラルネットワークに基づくトレーニング可能なCTRの構築を導出する。
論文 参考訳(メタデータ) (2022-04-28T12:34:41Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。