論文の概要: PromptEHR: Conditional Electronic Healthcare Records Generation with
Prompt Learning
- arxiv url: http://arxiv.org/abs/2211.01761v1
- Date: Tue, 11 Oct 2022 14:48:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 15:14:14.682458
- Title: PromptEHR: Conditional Electronic Healthcare Records Generation with
Prompt Learning
- Title(参考訳): PromptEHR: Prompt Learningによる条件付き電子医療記録生成
- Authors: Zifeng Wang and Jimeng Sun
- Abstract要約: 言語モデル (LM) によるテキストからテキストへの翻訳タスクとして EHR の生成を定式化することを提案する。
また、数値的・カテゴリー的人口統計学的特徴によって条件付けられた世代を制御するために、素早い学習を設計する。
MIMIC-IIIデータを用いた実験により,プライバシーリスクの低い現実的なEHR生成における手法の優位性を実証した。
- 参考スコア(独自算出の注目度): 42.859662256134584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accessing longitudinal multimodal Electronic Healthcare Records (EHRs) is
challenging due to privacy concerns, which hinders the use of ML for healthcare
applications. Synthetic EHRs generation bypasses the need to share sensitive
real patient records. However, existing methods generate single-modal EHRs by
unconditional generation or by longitudinal inference, which falls short of low
flexibility and makes unrealistic EHRs. In this work, we propose to formulate
EHRs generation as a text-to-text translation task by language models (LMs),
which suffices to highly flexible event imputation during generation. We also
design prompt learning to control the generation conditioned by numerical and
categorical demographic features. We evaluate synthetic EHRs quality by two
perplexity measures accounting for their longitudinal pattern (longitudinal
imputation perplexity, lpl) and the connections cross modalities
(cross-modality imputation perplexity, mpl). Moreover, we utilize two
adversaries: membership and attribute inference attacks for privacy-preserving
evaluation. Experiments on MIMIC-III data demonstrate the superiority of our
methods on realistic EHRs generation (53.1\% decrease of lpl and 45.3\%
decrease of mpl on average compared to the best baselines) with low privacy
risks. Software is available at https://github.com/RyanWangZf/PromptEHR.
- Abstract(参考訳): 長期にわたるマルチモーダル電子医療記録(EHR)へのアクセスは、プライバシ上の懸念から困難であり、医療アプリケーションにおけるMLの使用を妨げる。
合成eers生成は、センシティブな実際の患者記録を共有する必要性を回避します。
しかし、既存の手法では、非条件生成や長手推論によって単一モーダル EHR を生成し、低柔軟性に欠け、非現実的な EHR を生成する。
本研究では,言語モデル (LM) によるテキストからテキストへの翻訳タスクとして EHR の生成を定式化することを提案する。
また,数値的特徴とカテゴリー的特徴による生成条件を制御するために,プロンプト・ラーニングをデザインする。
合成ERHの品質を, 縦方向のパターン(縦方向のインプットパープレキシティ, lpl)と相互接続(横方向のインプットパープレキシティ, mpl)の2つの指標を用いて評価した。
さらに,プライバシ保護評価のために,メンバシップと属性推論攻撃という2つの敵を利用する。
MIMIC-IIIデータを用いた実験では、プライバシーリスクの低い現実的なERH(lpl:53.1\%、mpl:45.3\%)における手法の優位性を実証した。
ソフトウェアはhttps://github.com/RyanWangZf/PromptEHRで入手できる。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Guided Discrete Diffusion for Electronic Health Record Generation [47.129056768385084]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。
幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。
これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文 参考訳(メタデータ) (2024-04-18T16:50:46Z) - Collaborative Synthesis of Patient Records through Multi-Visit Health
State Inference [25.121296198656758]
協調EHR合成のための多視点健康状態推定モデルMSICを提案する。
確率的グラフィカルモデルとして合成EHR生成過程を定式化する。
我々は、過去の記録を効果的に活用し、現在および将来の記録を合成するために、マルチビジットシナリオに適した健康状態推定法を導出する。
論文 参考訳(メタデータ) (2023-12-22T12:28:29Z) - Reliable Generation of Privacy-preserving Synthetic Electronic Health Record Time Series via Diffusion Models [4.240899165468488]
電子健康記録(Electronic Health Records, EHRs)は、患者レベルの豊富なデータソースであり、医療データ分析に有用なリソースを提供する。
しかしながら、プライバシー上の懸念はしばしばEHRへのアクセスを制限し、下流の分析を妨げる。
本研究では,現実的かつプライバシに保護された合成ERH時系列を効率的に生成することで,これらの課題を克服することを目的とする。
論文 参考訳(メタデータ) (2023-10-23T18:56:01Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Generating Electronic Health Records with Multiple Data Types and
Constraints [17.32526100692928]
電子健康記録(EHR)を大規模に共有することは、プライバシー侵害につながる可能性がある。
近年の研究では、GAN(Generative Adversarial Network)フレームワークを通じてEHRをシミュレートすることでリスクを軽減できることが示されている。
本稿では,1)GANモデルの精細化,2)特徴制約の説明,3)そのような生成タスクに対する重要なユーティリティ対策の導入により,複数のデータタイプからなるEHRをシミュレートする手法を提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:16Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。