論文の概要: Generating Electronic Health Records with Multiple Data Types and
Constraints
- arxiv url: http://arxiv.org/abs/2003.07904v2
- Date: Mon, 23 Mar 2020 22:01:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 20:53:39.692984
- Title: Generating Electronic Health Records with Multiple Data Types and
Constraints
- Title(参考訳): 複数のデータ型と制約付き電子健康記録の作成
- Authors: Chao Yan, Ziqi Zhang, Steve Nyemba, Bradley A. Malin
- Abstract要約: 電子健康記録(EHR)を大規模に共有することは、プライバシー侵害につながる可能性がある。
近年の研究では、GAN(Generative Adversarial Network)フレームワークを通じてEHRをシミュレートすることでリスクを軽減できることが示されている。
本稿では,1)GANモデルの精細化,2)特徴制約の説明,3)そのような生成タスクに対する重要なユーティリティ対策の導入により,複数のデータタイプからなるEHRをシミュレートする手法を提案する。
- 参考スコア(独自算出の注目度): 17.32526100692928
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sharing electronic health records (EHRs) on a large scale may lead to privacy
intrusions. Recent research has shown that risks may be mitigated by simulating
EHRs through generative adversarial network (GAN) frameworks. Yet the methods
developed to date are limited because they 1) focus on generating data of a
single type (e.g., diagnosis codes), neglecting other data types (e.g.,
demographics, procedures or vital signs) and 2) do not represent constraints
between features. In this paper, we introduce a method to simulate EHRs
composed of multiple data types by 1) refining the GAN model, 2) accounting for
feature constraints, and 3) incorporating key utility measures for such
generation tasks. Our analysis with over $770,000$ EHRs from Vanderbilt
University Medical Center demonstrates that the new model achieves higher
performance in terms of retaining basic statistics, cross-feature correlations,
latent structural properties, feature constraints and associated patterns from
real data, without sacrificing privacy.
- Abstract(参考訳): 電子健康記録(EHR)を大規模に共有することは、プライバシー侵害につながる可能性がある。
近年の研究では、GAN(Generative Adversarial Network)フレームワークを通じてEHRをシミュレートすることでリスクを軽減することが示されている。
しかし、これまで開発された手法は限られている。
1)1つのタイプのデータ(診断符号など)の生成、他のタイプのデータ(人口統計学、手順、重要な兆候など)の無視、および
2) 特徴間の制約を表現しない。
本稿では,複数のデータ型からなるEHRをシミュレートする手法を提案する。
1) GANモデルを精錬する。
2)特徴的制約の計算、及び
3)このような生成作業において重要な効用措置を組み込むこと。
Vanderbilt University Medical Centerの70万ドル以上のEHRによる分析によると、この新モデルは、プライバシーを犠牲にすることなく、基本的な統計、クロスフィーチャー相関、潜在構造特性、機能制約、および実際のデータからの関連パターンを保持することで、より高いパフォーマンスを実現している。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Guided Discrete Diffusion for Electronic Health Record Generation [47.129056768385084]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。
幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。
これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文 参考訳(メタデータ) (2024-04-18T16:50:46Z) - Federated Causal Discovery from Heterogeneous Data [70.31070224690399]
任意の因果モデルと異種データに対応する新しいFCD法を提案する。
これらのアプローチには、データのプライバシを保護するために、生データのプロキシとして要約統計を構築することが含まれる。
提案手法の有効性を示すために, 合成および実データを用いた広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-02-20T18:53:53Z) - Reliable Generation of Privacy-preserving Synthetic Electronic Health Record Time Series via Diffusion Models [4.240899165468488]
電子健康記録(Electronic Health Records, EHRs)は、患者レベルの豊富なデータソースであり、医療データ分析に有用なリソースを提供する。
しかしながら、プライバシー上の懸念はしばしばEHRへのアクセスを制限し、下流の分析を妨げる。
本研究では,現実的かつプライバシに保護された合成ERH時系列を効率的に生成することで,これらの課題を克服することを目的とする。
論文 参考訳(メタデータ) (2023-10-23T18:56:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Categorical EHR Imputation with Generative Adversarial Nets [11.171712535005357]
本稿では,データ計算のためのGANに関する従来の研究を基にした,シンプルで効果的な手法を提案する。
従来のデータ計算手法に比べて予測精度が大幅に向上していることを示す。
論文 参考訳(メタデータ) (2021-08-03T18:50:26Z) - Hide-and-Seek Privacy Challenge [88.49671206936259]
NeurIPS 2020 Hide-and-Seek Privacy Challengeは、両方の問題を解決するための新しい2トラックの競争だ。
我々の頭から頭までのフォーマットでは、新しい高品質な集中ケア時系列データセットを用いて、合成データ生成トラック(「ヒッシャー」)と患者再識別トラック(「シーカー」)の参加者が直接対決する。
論文 参考訳(メタデータ) (2020-07-23T15:50:59Z) - Generation of Differentially Private Heterogeneous Electronic Health
Records [9.926231893220061]
本稿では, 合成異種EHRの生成にジェネレーティブ・アドバーサリアル・ネットワークを用いて検討する。
本稿では,DP 合成 EHR データセットを作成するために,差分プライバシ(DP)保存最適化の適用について検討する。
論文 参考訳(メタデータ) (2020-06-05T13:21:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。