論文の概要: MedDiff: Generating Electronic Health Records using Accelerated
Denoising Diffusion Model
- arxiv url: http://arxiv.org/abs/2302.04355v1
- Date: Wed, 8 Feb 2023 22:06:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-10 17:24:23.941951
- Title: MedDiff: Generating Electronic Health Records using Accelerated
Denoising Diffusion Model
- Title(参考訳): meddiff:accelerated denoising diffusion modelを用いた電子健康記録の作成
- Authors: Huan He, Shifan Zhao, Yuanzhe Xi, Joyce C Ho
- Abstract要約: 電子健康記録への最初の応用である拡散モデルに基づく新しい生成モデルを提案する。
本モデルでは,ラベル情報を保存するために,クラス条件サンプリングを行う機構を提案する。
- 参考スコア(独自算出の注目度): 5.677138915301383
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Due to patient privacy protection concerns, machine learning research in
healthcare has been undeniably slower and limited than in other application
domains. High-quality, realistic, synthetic electronic health records (EHRs)
can be leveraged to accelerate methodological developments for research
purposes while mitigating privacy concerns associated with data sharing. The
current state-of-the-art model for synthetic EHR generation is generative
adversarial networks, which are notoriously difficult to train and can suffer
from mode collapse. Denoising Diffusion Probabilistic Models, a class of
generative models inspired by statistical thermodynamics, have recently been
shown to generate high-quality synthetic samples in certain domains. It is
unknown whether these can generalize to generation of large-scale,
high-dimensional EHRs. In this paper, we present a novel generative model based
on diffusion models that is the first successful application on electronic
health records. Our model proposes a mechanism to perform class-conditional
sampling to preserve label information. We also introduce a new sampling
strategy to accelerate the inference speed. We empirically show that our model
outperforms existing state-of-the-art synthetic EHR generation methods.
- Abstract(参考訳): 患者のプライバシー保護に関する懸念から、医療における機械学習の研究は、他のアプリケーションドメインよりも明らかに遅く制限されている。
高品質で現実的な電子健康記録(ehrs)は、データ共有に関連するプライバシーの懸念を緩和しながら、研究目的の方法論開発を加速するために利用することができる。
合成EHR生成の最先端モデルは生成的敵ネットワークであり、訓練が困難であり、モード崩壊に苦しむことが知られている。
denoising diffusion probabilistic modelsは、統計熱力学に触発された生成モデルの一種で、最近、特定の領域で高品質な合成サンプルを生成することが示されている。
これらが大規模で高次元の EHR の生成に一般化できるかどうかは不明である。
本稿では,電子健康記録への最初の応用である拡散モデルに基づく新しい生成モデルを提案する。
本モデルは,ラベル情報を保存するためのクラス条件サンプリングを行う機構を提案する。
また, 推定速度を高速化するための新しいサンプリング戦略を提案する。
実験により、我々のモデルは既存の最先端の合成EHR生成方法よりも優れていることを示す。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Guided Discrete Diffusion for Electronic Health Record Generation [47.129056768385084]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。
幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。
これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文 参考訳(メタデータ) (2024-04-18T16:50:46Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - On the Stability of Iterative Retraining of Generative Models on their own Data [56.153542044045224]
混合データセットに対する生成モデルの訓練が与える影響について検討する。
まず、初期生成モデルがデータ分布を十分に近似する条件下で反復学習の安定性を実証する。
我々は、正規化フローと最先端拡散モデルを繰り返し訓練することにより、合成画像と自然画像の両方に関する我々の理論を実証的に検証する。
論文 参考訳(メタデータ) (2023-09-30T16:41:04Z) - EHRDiff: Exploring Realistic EHR Synthesis with Diffusion Models [8.799590232822752]
プライバシー上の懸念は、研究者のための高品質で大規模なEHRデータへのアクセスを制限している。
近年の研究では、生成モデリング技術による現実的なEHRデータの合成が研究されている。
本研究では, EHRデータ合成における拡散モデルの可能性について検討し, 新たな手法である EHRDiff を提案する。
論文 参考訳(メタデータ) (2023-03-10T02:15:58Z) - Synthesizing Mixed-type Electronic Health Records using Diffusion Models [10.973115905786129]
合成データ生成は、機密性の高い患者情報を共有する際のプライバシー上の懸念を軽減するための有望なソリューションである。
近年の研究では、拡散モデルは、より現実的な合成データの生成や、画像、テキスト、音声などのデータモダリティの生成における安定したトレーニングなど、GANに対していくつかの利点があることが示された。
実験の結果,TabDDPMは,プライバシーとユーティリティのトレードオフを確認するプライバシー以外のすべての評価指標において,最先端モデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-28T15:42:30Z) - Your Autoregressive Generative Model Can be Better If You Treat It as an
Energy-Based One [83.5162421521224]
本稿では,自己回帰生成モデルの学習のための独自のE-ARM法を提案する。
E-ARMは、よく設計されたエネルギーベースの学習目標を活用する。
我々は、E-ARMを効率的に訓練でき、露光バイアス問題を緩和できることを示した。
論文 参考訳(メタデータ) (2022-06-26T10:58:41Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。