論文の概要: EHRDiff: Exploring Realistic EHR Synthesis with Diffusion Models
- arxiv url: http://arxiv.org/abs/2303.05656v1
- Date: Fri, 10 Mar 2023 02:15:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-13 16:26:18.815027
- Title: EHRDiff: Exploring Realistic EHR Synthesis with Diffusion Models
- Title(参考訳): EHRDiff:拡散モデルによるリアルなEHR合成の探索
- Authors: Hongyi Yuan, Songchi Zhou, Sheng Yu
- Abstract要約: EHRには膨大な生物医学知識が含まれており、医療システムを開発するための豊富な資源である。
プライバシー上の懸念から、研究者がアクセス可能な高品質なEHRデータは限られている。
近年, 現実的なEHRデータを合成するための生成的モデリング手法が研究されている。
- 参考スコア(独自算出の注目度): 0.3356296640178535
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electronic health records (EHR) contain vast biomedical knowledge and are
rich resources for developing precise medicine systems. However, due to privacy
concerns, there are limited high-quality EHR data accessible to researchers
hence hindering the advancement of methodologies. Recent research has explored
using generative modelling methods to synthesize realistic EHR data, and most
proposed methods are based on the generative adversarial network (GAN) and its
variants for EHR synthesis. Although GAN-style methods achieved
state-of-the-art performance in generating high-quality EHR data, such methods
are hard to train and prone to mode collapse. Diffusion models are recently
proposed generative modelling methods and set cutting-edge performance in image
generation. The performance of diffusion models in realistic EHR synthesis is
rarely explored. In this work, we explore whether the superior performance of
diffusion models can translate to the domain of EHR synthesis and propose a
novel EHR synthesis method named EHRDiff. Through comprehensive experiments,
EHRDiff achieves new state-of-the-art performance for the quality of synthetic
EHR data and can better protect private information in real training EHRs in
the meanwhile.
- Abstract(参考訳): 電子健康記録(EHR)は、膨大な生物医学知識を含み、正確な医療システムを開発するための豊富な資源である。
しかし、プライバシー上の懸念から、研究者がアクセス可能な高品質なEHRデータに制限があるため、方法論の進歩を妨げている。
近年, 生成モデルを用いて現実的なEHRデータを合成する方法が研究されており, 提案手法はGAN(Generative Adversarial Network)とその変種に基づく。
GANスタイルの手法は高品質なEHRデータを生成する際に最先端の性能を達成したが、訓練は困難であり、モード崩壊の傾向にある。
拡散モデルは最近,画像生成における生成的モデリング手法と最先端性能の設定を提案している。
現実的なEHR合成における拡散モデルの性能はまれである。
本研究では, 拡散モデルの優れた性能が EHR 合成の領域に変換できるかどうかを考察し, EHRDiff という新しい EHR 合成法を提案する。
総合的な実験を通じて、EHRDiffは、合成EHRデータの品質のための新しい最先端のパフォーマンスを実現し、一方で実際の訓練EHRにおけるプライベート情報をよりよく保護することができる。
関連論文リスト
- Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation [59.184980778643464]
ファインチューニング拡散モデル : 生成人工知能(GenAI)の最前線
本稿では,拡散モデル(SPIN-Diffusion)のための自己演奏ファインチューニングという革新的な手法を紹介する。
提案手法は従来の教師付き微調整とRL戦略の代替として,モデル性能とアライメントの両方を大幅に改善する。
論文 参考訳(メタデータ) (2024-02-15T18:59:18Z) - Automated Fusion of Multimodal Electronic Health Records for Better
Medical Predictions [48.0590120095748]
本稿では,多様な入力モダリティと融合戦略を符号化する最適なモデルアーキテクチャを自動検索する,AutoFMという新しいニューラルネットワーク探索フレームワークを提案する。
我々は実世界のマルチモーダルEHRデータと予測タスクについて徹底的な実験を行い、その結果、我々のフレームワークが既存の最先端手法よりも大幅な性能向上を実現していることを示す。
論文 参考訳(メタデータ) (2024-01-20T15:14:14Z) - DifAugGAN: A Practical Diffusion-style Data Augmentation for GAN-based
Single Image Super-resolution [88.13972071356422]
本稿では,DifAugGAN として知られる GAN ベースの画像超解像法(SR) のための拡散型データ拡張手法を提案する。
それは、訓練中の判別器の校正を改善するために、生成拡散モデルに拡散過程を適用することを含む。
我々のDifAugGANは、現在のGANベースのSISR手法のプラグ・アンド・プレイ戦略であり、判別器の校正を改善し、SR性能を向上させることができる。
論文 参考訳(メタデータ) (2023-11-30T12:37:53Z) - Reliable Generation of EHR Time Series via Diffusion Models [4.549831511476249]
Denoising Diffusion Probabilistic Models (DDPM) を用いた多種多様なリアルなEHR時系列データ生成手法を提案する。
以上の結果から,本手法はトレーニングの労力を少なくしながら,データユーティリティの観点から既存手法を著しく上回る結果となった。
論文 参考訳(メタデータ) (2023-10-23T18:56:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - On the Stability of Iterative Retraining of Generative Models on their
own Data [56.153542044045224]
生成モデルの訓練がデータセット(実データと合成データの混合データ)の安定性に及ぼす影響について検討した。
まず、初期生成モデルがデータ分布を十分に近似する条件下で反復学習の安定性を実証する。
我々は,CIFAR10およびFFHQ上の正規化フローと最先端拡散モデルの反復的訓練により,合成画像と自然画像の両方に関する理論を実証的に検証した。
論文 参考訳(メタデータ) (2023-09-30T16:41:04Z) - MedDiff: Generating Electronic Health Records using Accelerated
Denoising Diffusion Model [5.677138915301383]
電子健康記録への最初の応用である拡散モデルに基づく新しい生成モデルを提案する。
本モデルでは,ラベル情報を保存するために,クラス条件サンプリングを行う機構を提案する。
論文 参考訳(メタデータ) (2023-02-08T22:06:34Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited
Data [125.7135706352493]
GAN(Generative Adversarial Network)は、高忠実度画像を合成するために、訓練に十分なデータを必要とする。
近年の研究では、差別者の過度な適合により、限られたデータでGANを訓練することは困難であることが示されている。
本稿では,APA (Adaptive Pseudo Augmentation) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-12T18:13:45Z) - EVA: Generating Longitudinal Electronic Health Records Using Conditional
Variational Autoencoders [34.22731849545798]
離散的な EHR の出会いと出会いの特徴を合成するための EHR Variational Autoencoder (EVA) を提案する。
EVAは現実的なシーケンスを生成でき、患者間の個人差を考慮し、特定の疾患条件で条件付けできる。
250,000人以上の患者を含む大規模な現実世界のEHRリポジトリの方法の有用性を評価します。
論文 参考訳(メタデータ) (2020-12-18T02:37:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。