論文の概要: Multi-Label Clinical Time-Series Generation via Conditional GAN
- arxiv url: http://arxiv.org/abs/2204.04797v1
- Date: Sun, 10 Apr 2022 23:30:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 17:01:42.518002
- Title: Multi-Label Clinical Time-Series Generation via Conditional GAN
- Title(参考訳): 条件付きGANによるマルチラベル臨床時系列生成
- Authors: Chang Lu, Chandan K. Reddy, Ping Wang, Dong Nie, Yue Ning
- Abstract要約: MTGAN(Multi-label Time-Series GAN)を提案する。
批評家はワッサースタイン距離を用いてスコアを与え、データと時間的特徴の両方を考慮することで、合成サンプルから実際のサンプルを認識する。
実験により, MTGANの合成データの品質と実効性を示す。
- 参考スコア(独自算出の注目度): 22.190517909833627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With wide applications of electronic health records (EHR), deep learning
methods have been adopted to analyze EHR data on various tasks such as
representation learning, clinical event prediction, and phenotyping. However,
due to privacy constraints, limited access to EHR becomes a bottleneck for deep
learning research. Recently, generative adversarial networks (GANs) have been
successful in generating EHR data. However, there are still challenges in
high-quality EHR generation, including generating time-series EHR and uncommon
diseases given imbalanced datasets. In this work, we propose a Multi-label
Time-series GAN (MTGAN) to generate EHR data and simultaneously improve the
quality of uncommon disease generation. The generator of MTGAN uses a gated
recurrent unit (GRU) with a smooth conditional matrix to generate sequences and
uncommon diseases. The critic gives scores using Wasserstein distance to
recognize real samples from synthetic samples by considering both data and
temporal features. We also propose a training strategy to calculate temporal
features for real data and stabilize GAN training. Furthermore, we design
multiple statistical metrics and prediction tasks to evaluate the generated
data. Experimental results demonstrate the quality of the synthetic data and
the effectiveness of MTGAN in generating realistic sequential EHR data,
especially for uncommon diseases.
- Abstract(参考訳): 電子健康記録(EHR)の幅広い応用により、表現学習、臨床イベント予測、表現型化といった様々なタスクにおいて、EHRデータを分析するための深層学習法が採用されている。
しかし、プライバシーの制約により、EHRへのアクセス制限はディープラーニング研究のボトルネックとなっている。
近年, GAN(Generative Adversarial Network)は, EHRデータの生成に成功している。
しかしながら、不均衡データセットが与えられた時系列のEHRや異常な疾患の生成など、高品質なEHR生成には依然として課題がある。
本稿では,ehrデータを生成し,稀な疾患発生の質も同時に向上させるマルチラベル時系列gan (mtgan) を提案する。
MTGANのジェネレータは、スムーズな条件行列を持つゲートリカレントユニット(GRU)を使用して、配列と異常な疾患を生成する。
批評家はワッサースタイン距離を用いてスコアを与え、データと時間的特徴の両方を考慮して合成サンプルから実際のサンプルを認識する。
また,実データに対する時間的特徴を算出し,gan学習を安定させるトレーニング戦略を提案する。
さらに,複数の統計指標と予測タスクを設計し,生成されたデータを評価する。
実験結果から, MTGANの生合成データの品質と, 現実的なシーケンシャルEHRデータ生成効果, 特に非一般的な疾患に対する有効性が確認された。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Guided Discrete Diffusion for Electronic Health Record Generation [47.129056768385084]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。
幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。
これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文 参考訳(メタデータ) (2024-04-18T16:50:46Z) - CEHR-GPT: Generating Electronic Health Records with Chronological Patient Timelines [14.386260536090628]
我々は合成データ生成に焦点をあて、特定の患者表現を用いてGPTモデルを訓練する能力を実証する。
これにより、観察医療成果パートナーシップ(OMOP)データフォーマットにシームレスに変換できる患者シーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-02-06T20:58:36Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Cumulative Stay-time Representation for Electronic Health Records in
Medical Event Time Prediction [8.261597797345342]
累積滞留時間表現(CTR)と呼ばれる新しいEMHデータ表現を提案する。
CTRはそのような累積的な健康状態を直接モデル化する。
我々は、ターゲットデータに適合する柔軟性を持つニューラルネットワークに基づくトレーニング可能なCTRの構築を導出する。
論文 参考訳(メタデータ) (2022-04-28T12:34:41Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。