論文の概要: PromptEHR: Conditional Electronic Healthcare Records Generation with
Prompt Learning
- arxiv url: http://arxiv.org/abs/2211.01761v1
- Date: Tue, 11 Oct 2022 14:48:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 15:14:14.682458
- Title: PromptEHR: Conditional Electronic Healthcare Records Generation with
Prompt Learning
- Title(参考訳): PromptEHR: Prompt Learningによる条件付き電子医療記録生成
- Authors: Zifeng Wang and Jimeng Sun
- Abstract要約: 言語モデル (LM) によるテキストからテキストへの翻訳タスクとして EHR の生成を定式化することを提案する。
また、数値的・カテゴリー的人口統計学的特徴によって条件付けられた世代を制御するために、素早い学習を設計する。
MIMIC-IIIデータを用いた実験により,プライバシーリスクの低い現実的なEHR生成における手法の優位性を実証した。
- 参考スコア(独自算出の注目度): 42.859662256134584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accessing longitudinal multimodal Electronic Healthcare Records (EHRs) is
challenging due to privacy concerns, which hinders the use of ML for healthcare
applications. Synthetic EHRs generation bypasses the need to share sensitive
real patient records. However, existing methods generate single-modal EHRs by
unconditional generation or by longitudinal inference, which falls short of low
flexibility and makes unrealistic EHRs. In this work, we propose to formulate
EHRs generation as a text-to-text translation task by language models (LMs),
which suffices to highly flexible event imputation during generation. We also
design prompt learning to control the generation conditioned by numerical and
categorical demographic features. We evaluate synthetic EHRs quality by two
perplexity measures accounting for their longitudinal pattern (longitudinal
imputation perplexity, lpl) and the connections cross modalities
(cross-modality imputation perplexity, mpl). Moreover, we utilize two
adversaries: membership and attribute inference attacks for privacy-preserving
evaluation. Experiments on MIMIC-III data demonstrate the superiority of our
methods on realistic EHRs generation (53.1\% decrease of lpl and 45.3\%
decrease of mpl on average compared to the best baselines) with low privacy
risks. Software is available at https://github.com/RyanWangZf/PromptEHR.
- Abstract(参考訳): 長期にわたるマルチモーダル電子医療記録(EHR)へのアクセスは、プライバシ上の懸念から困難であり、医療アプリケーションにおけるMLの使用を妨げる。
合成eers生成は、センシティブな実際の患者記録を共有する必要性を回避します。
しかし、既存の手法では、非条件生成や長手推論によって単一モーダル EHR を生成し、低柔軟性に欠け、非現実的な EHR を生成する。
本研究では,言語モデル (LM) によるテキストからテキストへの翻訳タスクとして EHR の生成を定式化することを提案する。
また,数値的特徴とカテゴリー的特徴による生成条件を制御するために,プロンプト・ラーニングをデザインする。
合成ERHの品質を, 縦方向のパターン(縦方向のインプットパープレキシティ, lpl)と相互接続(横方向のインプットパープレキシティ, mpl)の2つの指標を用いて評価した。
さらに,プライバシ保護評価のために,メンバシップと属性推論攻撃という2つの敵を利用する。
MIMIC-IIIデータを用いた実験では、プライバシーリスクの低い現実的なERH(lpl:53.1\%、mpl:45.3\%)における手法の優位性を実証した。
ソフトウェアはhttps://github.com/RyanWangZf/PromptEHRで入手できる。
関連論文リスト
- FairEHR-CLP: Towards Fairness-Aware Clinical Predictions with
Contrastive Learning in Multimodal Electronic Health Records [16.32613026455275]
本報告では,FairEHR-CLPについて述べる。
FairEHR-CLPは2段階のプロセスで動作し、患者の人口統計、縦断データ、臨床ノートを利用する。
サブグループ間での誤差率の差異を効果的に測定する新しい公正度尺度を導入する。
論文 参考訳(メタデータ) (2024-02-01T19:24:45Z) - EHRAgent: Code Empowers Large Language Models for Few-shot Complex
Tabular Reasoning on Electronic Health Records [48.9788858020623]
大規模言語モデル(LLM)は、計画とツールの利用において例外的な能力を示した。
コードインタフェースを備えたLLMエージェントであるEHRAgentを提案し,マルチタブラル推論のためのコードの自動生成と実行を行う。
論文 参考訳(メタデータ) (2024-01-13T18:09:05Z) - Collaborative Synthesis of Patient Records through Multi-Visit Health
State Inference [25.121296198656758]
協調EHR合成のための多視点健康状態推定モデルMSICを提案する。
確率的グラフィカルモデルとして合成EHR生成過程を定式化する。
我々は、過去の記録を効果的に活用し、現在および将来の記録を合成するために、マルチビジットシナリオに適した健康状態推定法を導出する。
論文 参考訳(メタデータ) (2023-12-22T12:28:29Z) - Beyond Human Data: Scaling Self-Training for Problem-Solving with
Language Models [116.19321613273311]
人為的なデータに基づく微調整言語モデル(LM)が普及している。
我々は、スカラーフィードバックにアクセス可能なタスクにおいて、人間のデータを超えることができるかどうか検討する。
ReST$EM$はモデルサイズに好適にスケールし、人間のデータのみによる微調整を大幅に上回っていることがわかった。
論文 参考訳(メタデータ) (2023-12-11T18:17:43Z) - Multi-Label Clinical Time-Series Generation via Conditional GAN [23.380183382491495]
MTGAN(Multi-label Time-Series GAN)を用いて,EMHデータと不均衡な疾患を生成する。
批評家はワッサースタイン距離を用いてスコアを与え、データと時間的特徴の両方を考慮することで、合成サンプルから実際のサンプルを認識する。
実験により, MTGANの合成データの品質と実効性を示す。
論文 参考訳(メタデータ) (2022-04-10T23:30:07Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Generating Electronic Health Records with Multiple Data Types and
Constraints [17.32526100692928]
電子健康記録(EHR)を大規模に共有することは、プライバシー侵害につながる可能性がある。
近年の研究では、GAN(Generative Adversarial Network)フレームワークを通じてEHRをシミュレートすることでリスクを軽減できることが示されている。
本稿では,1)GANモデルの精細化,2)特徴制約の説明,3)そのような生成タスクに対する重要なユーティリティ対策の導入により,複数のデータタイプからなるEHRをシミュレートする手法を提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:16Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。