論文の概要: EVA: Generating Longitudinal Electronic Health Records Using Conditional
Variational Autoencoders
- arxiv url: http://arxiv.org/abs/2012.10020v1
- Date: Fri, 18 Dec 2020 02:37:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:24:23.605278
- Title: EVA: Generating Longitudinal Electronic Health Records Using Conditional
Variational Autoencoders
- Title(参考訳): EVA:条件付き変分オートエンコーダを用いた縦型電子健康記録の生成
- Authors: Siddharth Biswal, Soumya Ghosh, Jon Duke, Bradley Malin, Walter
Stewart and Jimeng Sun
- Abstract要約: 離散的な EHR の出会いと出会いの特徴を合成するための EHR Variational Autoencoder (EVA) を提案する。
EVAは現実的なシーケンスを生成でき、患者間の個人差を考慮し、特定の疾患条件で条件付けできる。
250,000人以上の患者を含む大規模な現実世界のEHRリポジトリの方法の有用性を評価します。
- 参考スコア(独自算出の注目度): 34.22731849545798
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Researchers require timely access to real-world longitudinal electronic
health records (EHR) to develop, test, validate, and implement machine learning
solutions that improve the quality and efficiency of healthcare. In contrast,
health systems value deeply patient privacy and data security. De-identified
EHRs do not adequately address the needs of health systems, as de-identified
data are susceptible to re-identification and its volume is also limited.
Synthetic EHRs offer a potential solution. In this paper, we propose EHR
Variational Autoencoder (EVA) for synthesizing sequences of discrete EHR
encounters (e.g., clinical visits) and encounter features (e.g., diagnoses,
medications, procedures). We illustrate that EVA can produce realistic EHR
sequences, account for individual differences among patients, and can be
conditioned on specific disease conditions, thus enabling disease-specific
studies. We design efficient, accurate inference algorithms by combining
stochastic gradient Markov Chain Monte Carlo with amortized variational
inference. We assess the utility of the methods on large real-world EHR
repositories containing over 250, 000 patients. Our experiments, which include
user studies with knowledgeable clinicians, indicate the generated EHR
sequences are realistic. We confirmed the performance of predictive models
trained on the synthetic data are similar with those trained on real EHRs.
Additionally, our findings indicate that augmenting real data with synthetic
EHRs results in the best predictive performance - improving the best baseline
by as much as 8% in top-20 recall.
- Abstract(参考訳): 研究者は、医療の質と効率を改善する機械学習ソリューションの開発、テスト、検証、実装のために、現実世界の経時的電子健康記録(EHR)にタイムリーにアクセスする必要がある。
対照的に、医療システムは患者のプライバシーとデータセキュリティを深く重視する。
身元不明の EHR は、身元不明のデータは再身元不明になり、容積も制限されるため、健康システムのニーズに適切に対処しない。
合成EHRは潜在的な解決策を提供する。
本稿では,個別のEHR遭遇(例えば臨床訪問)と遭遇特徴(例えば,診断,薬品,処置)を合成するためのEVA(EHR Variational Autoencoder)を提案する。
EVA は現実的な EHR 配列を生成でき、患者間の個人差を考慮し、特定の疾患状況に適応できるので、疾患特異的な研究が可能になる。
確率的勾配マルコフ連鎖モンテカルロと不定形変分推論を組み合わせた効率的高精度な推論アルゴリズムを設計した。
我々は,250,000人以上の患者を含む大規模実世界のERHリポジトリにおける手法の有用性を評価した。
本研究は,知識豊富な臨床医によるユーザスタディを含め,ehrシーケンスの生成が現実的であることを示唆する。
合成データでトレーニングされた予測モデルの性能は実際のeersでトレーニングされたモデルと類似していることを確認した。
さらに, 合成EHRによる実データの増大は, 最高の予測性能をもたらすことが示唆され, 上位20回のリコールにおいて, 最大8%のベースライン改善が達成された。
関連論文リスト
- IGNITE: Individualized GeNeration of Imputations in Time-series
Electronic health records [7.451873794596469]
本研究では、患者動態を学習し、個人の人口動態の特徴や治療に合わせたパーソナライズされた値を生成する新しいディープラーニングモデルを提案する。
提案モデルであるIGNITEは,2段階の注意を付加した条件付き2変分オートエンコーダを用いて,個人に対して欠落した値を生成する。
IGNITEは,データ再構成の欠如やタスク予測において,最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-01-09T07:57:21Z) - Reliable Generation of Privacy-preserving Synthetic Electronic Health Record Time Series via Diffusion Models [4.240899165468488]
電子健康記録(Electronic Health Records, EHRs)は、患者レベルの豊富なデータソースであり、医療データ分析に有用なリソースを提供する。
しかしながら、プライバシー上の懸念はしばしばEHRへのアクセスを制限し、下流の分析を妨げる。
本研究では,現実的かつプライバシに保護された合成ERH時系列を効率的に生成することで,これらの課題を克服することを目的とする。
論文 参考訳(メタデータ) (2023-10-23T18:56:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Synthesize High-dimensional Longitudinal Electronic Health Records via
Hierarchical Autoregressive Language Model [40.473866438962034]
合成電子健康記録は、機械学習(ML)モデリングと統計解析のための実際のEHRの代替として機能することができる。
階層型自己回帰言語mOdel(HALO)を提案する。
論文 参考訳(メタデータ) (2023-04-04T23:53:34Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - Integrated Convolutional and Recurrent Neural Networks for Health Risk
Prediction using Patient Journey Data with Many Missing Values [9.418011774179794]
本稿では,統合畳み込みニューラルネットワークとリカレントニューラルネットワークを用いたEMH患者旅行データモデリングのためのエンドツーエンドアプローチを提案する。
本モデルでは,各患者旅行における長期的・短期的時間的パターンを抽出し,インパルスデータ生成を伴わずに,高レベルのEHRデータの欠落を効果的に処理することができる。
論文 参考訳(メタデータ) (2022-11-11T07:36:18Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。