論文の概要: Textual Data Augmentation for Patient Outcomes Prediction
- arxiv url: http://arxiv.org/abs/2211.06778v1
- Date: Sun, 13 Nov 2022 01:07:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 15:51:02.619210
- Title: Textual Data Augmentation for Patient Outcomes Prediction
- Title(参考訳): 患者の予後予測のためのテキストデータ拡張
- Authors: Qiuhao Lu, Dejing Dou, Thien Huu Nguyen
- Abstract要約: 本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
- 参考スコア(独自算出の注目度): 67.72545656557858
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning models have demonstrated superior performance in various
healthcare applications. However, the major limitation of these deep models is
usually the lack of high-quality training data due to the private and sensitive
nature of this field. In this study, we propose a novel textual data
augmentation method to generate artificial clinical notes in patients'
Electronic Health Records (EHRs) that can be used as additional training data
for patient outcomes prediction. Essentially, we fine-tune the generative
language model GPT-2 to synthesize labeled text with the original training
data. More specifically, We propose a teacher-student framework where we first
pre-train a teacher model on the original data, and then train a student model
on the GPT-augmented data under the guidance of the teacher. We evaluate our
method on the most common patient outcome, i.e., the 30-day readmission rate.
The experimental results show that deep models can improve their predictive
performance with the augmented data, indicating the effectiveness of the
proposed architecture.
- Abstract(参考訳): ディープラーニングモデルは、さまざまな医療アプリケーションにおいて優れたパフォーマンスを示している。
しかしながら、これらの深層モデルの主な制限は、通常、この分野のプライベートで繊細な性質のため、高品質なトレーニングデータがないことである。
そこで本研究では,患者の電子健康記録(ehrs)から,患者の予後予測のための追加訓練データとして使用できる人工的な臨床記録を生成するためのテキストデータ拡張手法を提案する。
基本的に、生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
より具体的には、教師の指導のもと、まず、原データ上で教師モデルを事前訓練し、GPT拡張データ上で生徒モデルを訓練する教師学生フレームワークを提案する。
本法を最も一般的な患者、すなわち30日間の寛解率について評価した。
実験の結果,深層モデルでは拡張データにより予測性能が向上し,提案手法の有効性が示された。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Recent Advances in Predictive Modeling with Electronic Health Records [71.19967863320647]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - A Comprehensive Benchmark for COVID-19 Predictive Modeling Using
Electronic Health Records in Intensive Care [15.64030213048907]
集中治療室における新型コロナウイルス患者のアウトカム特異的長期予測と早期死亡予測の2つの臨床予測課題を提案する。
この2つの課題は、新型コロナウイルス(COVID-19)患者の臨床実践に対応するため、単純で不安定な長寿と死亡予測のタスクから適応される。
我々は、公平で詳細なオープンソースのデータ前処理パイプラインを提案し、2つのタスクで17の最先端予測モデルを評価する。
論文 参考訳(メタデータ) (2022-09-16T09:09:15Z) - Unsupervised Pre-Training on Patient Population Graphs for Patient-Level
Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。
本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。
提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文 参考訳(メタデータ) (2022-03-23T17:59:45Z) - Bridging the Gap Between Patient-specific and Patient-independent
Seizure Prediction via Knowledge Distillation [7.2666838978096875]
既存のアプローチは通常、てんかんの信号の高度にパーソナライズされた特性のために、患者固有の方法でモデルを訓練する。
患者固有のモデルは、蒸留された知識と追加のパーソナライズされたデータによって得られる。
提案手法を用いて,CHB-MIT sEEGデータベース上で5つの最先端の発作予測法を訓練する。
論文 参考訳(メタデータ) (2022-02-25T10:30:29Z) - Pre-training transformer-based framework on large-scale pediatric claims
data for downstream population-specific tasks [3.1580072841682734]
本研究は、小児科のクレームデータセット全体をトレーニングする一般的な事前学習モデルであるClaim Pre-Training(Claim-PT)フレームワークを提案する。
効果的な知識伝達はタスク対応微調整段階を通じて完了する。
我々は100万人以上の患者記録を持つ実世界のクレームデータセットの実験を行った。
論文 参考訳(メタデータ) (2021-06-24T15:25:41Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - Language Models Are An Effective Patient Representation Learning
Technique For Electronic Health Record Data [7.260199064831896]
本研究では,自然言語処理技術に触発された患者表現方式により,臨床予測モデルの精度が向上することを示す。
このような患者表現方式は、標準的な基準よりも5つの予測タスクにおいて、3.5%の平均的なAUROCの改善を可能にする。
論文 参考訳(メタデータ) (2020-01-06T22:24:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。