論文の概要: Paging Dr. GPT: Extracting Information from Clinical Notes to Enhance Patient Predictions
- arxiv url: http://arxiv.org/abs/2504.12338v1
- Date: Mon, 14 Apr 2025 17:41:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-18 14:38:45.183476
- Title: Paging Dr. GPT: Extracting Information from Clinical Notes to Enhance Patient Predictions
- Title(参考訳): Paging Dr. GPT: 臨床ノートから患者予測への情報抽出
- Authors: David Anderson, Michaela Anderson, Margret Bjarnadottir, Stephen Mahar, Shriyan Reyya,
- Abstract要約: GPT-4o-mini (ChatGPT) による患者に対する簡単な臨床質問に対する回答が患者レベルの死亡予測にどう役立つかを検討する。
MIMIC-IV Noteデータセットにおける14,011件の初診データや心血管集中治療ユニットのデータを用いて,GPT応答をロジスティック回帰モデルにおける入力特徴として用いた透明なフレームワークを実装した。
- 参考スコア(独自算出の注目度): 0.25165775267615204
- License:
- Abstract: There is a long history of building predictive models in healthcare using tabular data from electronic medical records. However, these models fail to extract the information found in unstructured clinical notes, which document diagnosis, treatment, progress, medications, and care plans. In this study, we investigate how answers generated by GPT-4o-mini (ChatGPT) to simple clinical questions about patients, when given access to the patient's discharge summary, can support patient-level mortality prediction. Using data from 14,011 first-time admissions to the Coronary Care or Cardiovascular Intensive Care Units in the MIMIC-IV Note dataset, we implement a transparent framework that uses GPT responses as input features in logistic regression models. Our findings demonstrate that GPT-based models alone can outperform models trained on standard tabular data, and that combining both sources of information yields even greater predictive power, increasing AUC by an average of 5.1 percentage points and increasing positive predictive value by 29.9 percent for the highest-risk decile. These results highlight the value of integrating large language models (LLMs) into clinical prediction tasks and underscore the broader potential for using LLMs in any domain where unstructured text data remains an underutilized resource.
- Abstract(参考訳): 医療における予測モデルの構築には,電子カルテの表形式でのデータを用いた長い歴史がある。
しかし、これらのモデルは、診断、治療、進歩、医薬品、およびケア計画の文書化を含む、構造化されていない臨床ノートで見つかった情報を抽出することができない。
本研究では,GPT-4o-mini (ChatGPT) の患者に対する簡単な臨床質問に対する回答について検討した。
MIMIC-IV Noteデータセットにおける14,011件の初診データや心血管集中治療ユニットのデータを用いて,GPT応答をロジスティック回帰モデルにおける入力特徴として用いた透明なフレームワークを実装した。
以上の結果から,GPTモデルだけでは標準表データでトレーニングされたモデルよりも優れており,両者の情報源を組み合わせることにより,AUCが平均5.1ポイント,正の予測値が29.9%向上することが示唆された。
これらの結果は, 大規模言語モデル(LLM)を臨床予測タスクに統合することの価値を強調し, 構造化されていないテキストデータが未利用資源である領域において, LLMを使うことの可能性を明らかにする。
関連論文リスト
- Enhancing In-Hospital Mortality Prediction Using Multi-Representational Learning with LLM-Generated Expert Summaries [3.5508427067904864]
ICU患者の院内死亡率(IHM)予測は、時間的介入と効率的な資源配分に重要である。
本研究は、構造化された生理データと臨床ノートをLarge Language Model(LLM)によって生成された専門家要約と統合し、IHM予測精度を向上させる。
論文 参考訳(メタデータ) (2024-11-25T16:36:38Z) - Fine-Tuning In-House Large Language Models to Infer Differential Diagnosis from Radiology Reports [1.5972172622800358]
本研究は, 放射線学報告と鑑別診断に適した社内LPMの開発パイプラインを提案する。
GPT-4と同等の92.1%のF1スコアが得られた。
論文 参考訳(メタデータ) (2024-10-11T20:16:25Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - Evaluating the Fairness of the MIMIC-IV Dataset and a Baseline
Algorithm: Application to the ICU Length of Stay Prediction [65.268245109828]
本稿では、MIMIC-IVデータセットを用いて、滞在時間を予測するXGBoostバイナリ分類モデルにおける公平性とバイアスについて検討する。
この研究は、人口統計属性にわたるデータセットのクラス不均衡を明らかにし、データ前処理と特徴抽出を採用する。
この論文は、偏見を緩和するための公正な機械学習技術と、医療専門家とデータサイエンティストの協力的な努力の必要性について結論付けている。
論文 参考訳(メタデータ) (2023-12-31T16:01:48Z) - Multimodal Pretraining of Medical Time Series and Notes [45.89025874396911]
ディープラーニングモデルは、意味のあるパターンを抽出する際の約束を示すが、広範囲なラベル付きデータが必要である。
本稿では,臨床測定値とノートのアライメントに着目し,自己指導型事前学習を用いた新しいアプローチを提案する。
病院内での死亡予測や表現型化などの下流タスクでは、データのごく一部がラベル付けされた設定において、ベースラインよりも優れています。
論文 参考訳(メタデータ) (2023-12-11T21:53:40Z) - Knowledge Graph Representations to enhance Intensive Care Time-Series
Predictions [4.660203987415476]
提案手法は,ICUデータと医療知識を統合し,臨床意思決定モデルを改善する。
グラフ表現とバイタルサインと臨床報告を組み合わせることで、パフォーマンスを向上させる。
我々のモデルには、知識グラフノードが予測にどのように影響するかを理解するための解釈可能性コンポーネントが含まれています。
論文 参考訳(メタデータ) (2023-11-13T09:11:55Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Literature-Augmented Clinical Outcome Prediction [10.46990394710927]
EBMとAIベースの臨床モデルとのギャップを埋める技術を導入する。
集中治療(ICU)患者情報に基づいて患者固有の文献を自動的に検索するシステムを提案する。
我々のモデルは,最近の強靭なベースラインと比較して,3つの課題に対する予測精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-11-16T11:19:02Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。