論文の概要: Leveraging Large Language Models to Enhance Machine Learning Interpretability and Predictive Performance: A Case Study on Emergency Department Returns for Mental Health Patients
- arxiv url: http://arxiv.org/abs/2502.00025v1
- Date: Tue, 21 Jan 2025 15:41:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-09 08:11:47.087953
- Title: Leveraging Large Language Models to Enhance Machine Learning Interpretability and Predictive Performance: A Case Study on Emergency Department Returns for Mental Health Patients
- Title(参考訳): 機械学習の解釈可能性と予測性能を高めるための大規模言語モデルの活用:メンタルヘルス患者の救急部門復帰を事例として
- Authors: Abdulaziz Ahmed, Mohammad Saleem, Mohammed Alzeen, Badari Birur, Rachel E Fargason, Bradley G Burk, Hannah Rose Harkins, Ahmed Alhassan, Mohammed Ali Al-Garadi,
- Abstract要約: この振り返りコホート研究は、27,904人のメンタルヘルス患者42,464人のED訪問を分析した。
大規模言語モデル(LLM)を活用する機械学習の解釈可能性フレームワークは、複雑なモデル予測を臨床的に関連する説明に変換する際に、99%の精度を達成した。
- 参考スコア(独自算出の注目度): 2.3769374446083735
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective: To evaluate whether integrating large language models (LLMs) with traditional machine learning approaches improves both the predictive accuracy and clinical interpretability of ED mental health returns risk models. Methods: This retrospective cohort study analyzed 42,464 ED visits for 27,904 unique mental health patients at an Academic Medical Center in the deep South of the United States between January 2018 and December 2022. Main Outcomes and Measures: Two primary outcomes were evaluated: (1) 30 days ED return prediction accuracy and (2) model interpretability through a novel retrieval-augmented generation (RAG) framework integrating SHAP (SHapley Additive exPlanations) values with contextual clinical knowledge. Results: The proposed machine learning interpretability framework, leveraging LLM, achieved 99% accuracy in translating complex model predictions into clinically relevant explanations. Integration of LLM-extracted features enhanced predictive performance, improving the XGBoost model area under the curve (AUC) from 0.73 to 0.76. The LLM-based feature extraction using 10-shot learning significantly outperformed traditional approaches, achieving an accuracy of 0.882 and an F1 score of 0.86 for chief complaint classification (compared to conventional methods with an accuracy range of 0.59 to 0.63) and demonstrating accuracy values ranging from 0.65 to 0.93 across multiple SDoH categories, underscoring its robust performance in extracting features from clinical notes. Conclusions and Relevance: Integrating LLMs with traditional machine learning models yielded modest but consistent improvements in ED return prediction accuracy while substantially enhancing model interpretability through automated, clinically relevant explanations. This approach offers a framework for translating complex predictive analytics into actionable clinical insights.
- Abstract(参考訳): 目的: 大規模言語モデル(LLM)と従来の機械学習アプローチの統合が、EDメンタルヘルスの予測精度と臨床解釈可能性の両方を改善するかどうかを評価する。
方法】2018年1月から2022年12月にかけて、米国南部のアカデミック・メディカル・センター(Academic Medical Center)において、27,904人のメンタルヘルス患者42,464人を対象に調査を行った。
主な成果と対策として,(1)30日間のED戻り予測精度と(2)新しい検索強化世代(RAG)フレームワークによるモデル解釈可能性について,SHAP(SHapley Additive exPlanations)値を文脈的臨床知識と組み合わせて評価した。
結果: LLMを応用した機械学習解釈可能性フレームワークは, 複雑なモデル予測を臨床的に意味のある説明に翻訳する際に, 99%の精度を達成した。
LLM抽出機能の統合により予測性能が向上し、曲線(AUC)下のXGBoostモデル領域が0.73から0.76に改善した。
10ショット学習を用いたLCMによる特徴抽出は従来の手法よりも有意に優れており, 主訴分類における精度0.882とF1スコア0.86(従来法では0.59から0.63)を達成し, 複数のSDoHカテゴリで0.65から0.93の範囲の精度を実証した。
結論と関連性: 従来の機械学習モデルとLLMを統合することで、ED戻り予測精度は適度に改善され、自動的、臨床的に関係のある説明を通じてモデルの解釈可能性を大幅に向上した。
このアプローチは、複雑な予測分析を実行可能な臨床的洞察に変換するためのフレームワークを提供する。
関連論文リスト
- Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Enhancing In-Hospital Mortality Prediction Using Multi-Representational Learning with LLM-Generated Expert Summaries [3.5508427067904864]
ICU患者の院内死亡率(IHM)予測は、時間的介入と効率的な資源配分に重要である。
本研究は、構造化された生理データと臨床ノートをLarge Language Model(LLM)によって生成された専門家要約と統合し、IHM予測精度を向上させる。
論文 参考訳(メタデータ) (2024-11-25T16:36:38Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - Predicting Deterioration in Mild Cognitive Impairment with Survival Transformers, Extreme Gradient Boosting and Cox Proportional Hazard Modelling [0.08399688944263844]
本稿では,認知の劣化を予測するために,サバイバル・トランスフォーマーの新たなアプローチと極勾配促進モデルを提案する。
提案手法は、アルツハイマー認知症における早期発見と介入をより正確にするためのこれらの手法の可能性を強調している。
論文 参考訳(メタデータ) (2024-09-24T16:49:43Z) - Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database [1.5186937600119894]
心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。
広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は、完全には理解されていない。
本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
論文 参考訳(メタデータ) (2024-09-03T07:57:08Z) - Data-Driven Machine Learning Approaches for Predicting In-Hospital Sepsis Mortality [0.0]
セプシスはアメリカ合衆国と世界中で多くの死者を負う重篤な状態である。
機械学習を用いたこれまでの研究では、特徴選択とモデル解釈可能性に制限があった。
本研究は,院内敗血症死亡率を予測するための,解釈可能かつ正確な機械学習モデルを開発することを目的とした。
論文 参考訳(メタデータ) (2024-08-03T00:28:25Z) - Enhanced Prediction of Ventilator-Associated Pneumonia in Patients with Traumatic Brain Injury Using Advanced Machine Learning Techniques [0.0]
外傷性脳損傷(TBI)患者の呼吸器関連肺炎(VAP)は重大な死亡リスクをもたらす。
TBI患者のVAPのタイムリーな検出と予後は、患者の予後を改善し、医療資源の負担を軽減するために重要である。
我々はMIMIC-IIIデータベースを用いて6つの機械学習モデルを実装した。
論文 参考訳(メタデータ) (2024-08-02T09:44:18Z) - Improving Machine Learning Based Sepsis Diagnosis Using Heart Rate Variability [0.0]
本研究の目的は、心拍変動(HRV)機能を用いて、敗血症検出のための効果的な予測モデルを開発することである。
ニューラルネットワークモデルは、HRVの特徴に基づいてトレーニングされ、F1スコアは0.805、精度は0.851、リコールは0.763である。
論文 参考訳(メタデータ) (2024-08-01T01:47:29Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - SemioLLM: Evaluating Large Language Models for Diagnostic Reasoning from Unstructured Clinical Narratives in Epilepsy [45.2233252981348]
臨床知識を符号化するための言語モデル(LLM)が示されている。
6つの最先端モデルをベンチマークする評価フレームワークであるSemioLLMを提案する。
ほとんどのLSMは、脳内の発作発生領域の確率的予測を正確かつ確実に生成できることを示す。
論文 参考訳(メタデータ) (2024-07-03T11:02:12Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - A Knowledge Distillation Ensemble Framework for Predicting Short and
Long-term Hospitalisation Outcomes from Electronic Health Records Data [5.844828229178025]
既存の結果予測モデルは、頻繁なポジティブな結果の低いリコールに悩まされる。
我々は、死亡率とICUの受け入れによって表される逆さを自動的に予測する、高度にスケーリング可能な、堅牢な機械学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-18T15:56:28Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。