論文の概要: Cost-Aware Prediction (CAP): An LLM-Enhanced Machine Learning Pipeline and Decision Support System for Heart Failure Mortality Prediction
- arxiv url: http://arxiv.org/abs/2511.15357v1
- Date: Wed, 19 Nov 2025 11:34:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.783076
- Title: Cost-Aware Prediction (CAP): An LLM-Enhanced Machine Learning Pipeline and Decision Support System for Heart Failure Mortality Prediction
- Title(参考訳): コストアウェア予測(CAP):LLM強化機械学習パイプラインと心不全死亡予測のための決定支援システム
- Authors: Yinan Yu, Falk Dippel, Christina E. Lundberg, Martin Lindgren, Annika Rosengren, Martin Adiels, Helen Sjöland,
- Abstract要約: 本稿では,大規模言語モデル(LLM)エージェントによる費用対効果分析を組み合わせたコスト対効果予測(CAP)フレームワークを提案する。
心臓不全患者の1年間の死亡を予測できるMLモデルを構築した。
- 参考スコア(独自算出の注目度): 2.6045133848979214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: Machine learning (ML) predictive models are often developed without considering downstream value trade-offs and clinical interpretability. This paper introduces a cost-aware prediction (CAP) framework that combines cost-benefit analysis assisted by large language model (LLM) agents to communicate the trade-offs involved in applying ML predictions. Materials and Methods: We developed an ML model predicting 1-year mortality in patients with heart failure (N = 30,021, 22% mortality) to identify those eligible for home care. We then introduced clinical impact projection (CIP) curves to visualize important cost dimensions - quality of life and healthcare provider expenses, further divided into treatment and error costs, to assess the clinical consequences of predictions. Finally, we used four LLM agents to generate patient-specific descriptions. The system was evaluated by clinicians for its decision support value. Results: The eXtreme gradient boosting (XGB) model achieved the best performance, with an area under the receiver operating characteristic curve (AUROC) of 0.804 (95% confidence interval (CI) 0.792-0.816), area under the precision-recall curve (AUPRC) of 0.529 (95% CI 0.502-0.558) and a Brier score of 0.135 (95% CI 0.130-0.140). Discussion: The CIP cost curves provided a population-level overview of cost composition across decision thresholds, whereas LLM-generated cost-benefit analysis at individual patient-levels. The system was well received according to the evaluation by clinicians. However, feedback emphasizes the need to strengthen the technical accuracy for speculative tasks. Conclusion: CAP utilizes LLM agents to integrate ML classifier outcomes and cost-benefit analysis for more transparent and interpretable decision support.
- Abstract(参考訳): 目的: 機械学習(ML)予測モデルは、下流値のトレードオフや臨床解釈可能性を考慮することなく、しばしば開発される。
本稿では,大規模言語モデル(LLM)エージェントによる費用対効果分析を組み合わせたコスト対効果予測(CAP)フレームワークを提案する。
対象と方法: 心不全(N=30,021,22%死亡)患者の1年間の死亡を予測できるMLモデルを構築した。
臨床効果予測曲線(CIP曲線)を導入し,生命の質,医療提供者費用,さらに治療とエラー費用に区分し,予測の臨床的結果を評価する。
最後に、患者固有の記述を生成するために、LLMエージェントを4つ使用した。
このシステムは, 臨床医による意思決定支援値の評価を行った。
結果: eXtreme gradient boosting (XGB) モデルは, 受信機動作特性曲線 (AUROC) が0.804 (95%信頼区間 (CI) 0.792-0.816, 精度・リコール曲線 (AUPRC) が0.529 (95% CI 0.502-0.558) の領域が0.135 (95% CI 0.130-0.140) の領域で最高の性能を示した。
考察: CIPコスト曲線は, 患者レベルでのLCM生成コストベネフィット分析とは対照的に, 決定しきい値におけるコスト構成の集団レベルでの概略を示した。
システムの評価は臨床医による評価で良好であった。
しかし、フィードバックは投機的タスクの技術的正確性を強化する必要性を強調している。
結論:CAPはLLMエージェントを使用してML分類結果とコスト対効果分析を統合し,より透明性と解釈可能な意思決定支援を行う。
関連論文リスト
- Early Mortality Prediction in ICU Patients with Hypertensive Kidney Disease Using Interpretable Machine Learning [3.4335475695580127]
集中治療室(ICUs)の高血圧性腎疾患(HKD)患者は短期的死亡率が高い。
我々は,HKDのICU患者に対して,30日間の院内死亡を予測できる機械学習フレームワークを開発した。
論文 参考訳(メタデータ) (2025-07-25T00:48:23Z) - AUTOCT: Automating Interpretable Clinical Trial Prediction with LLM Agents [47.640779069547534]
AutoCTは、大規模言語モデルの推論能力と古典的な機械学習の説明可能性を組み合わせた、新しいフレームワークである。
臨床治験予測タスクにおいて, AutoCT は SOTA 法と同等以上の性能を示した。
論文 参考訳(メタデータ) (2025-06-04T11:50:55Z) - Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.1574468325115]
本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。
評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文 参考訳(メタデータ) (2025-05-23T14:06:42Z) - Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Explainable AI for Mental Health Emergency Returns: Integrating LLMs with Predictive Modeling [2.466324275447403]
救急部門(ED)は精神状態の回復が大きな医療負担となり、患者の24-27%が30日以内に帰国する。
大規模言語モデル(LLM)と機械学習を統合することにより、EDメンタルヘルスリターンリスクモデルの予測精度と臨床的解釈性が向上するか否かを評価する。
論文 参考訳(メタデータ) (2025-01-21T15:41:20Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - Improving Clinical Decision Support through Interpretable Machine Learning and Error Handling in Electronic Health Records [6.594072648536156]
Trust-MAPSは、臨床領域の知識を高次元の混合整数プログラミングモデルに変換する。
信頼スコアは、臨床決定支援タスクの予測性能を高めるだけでなく、MLモデルに解釈可能性を与える臨床的に有意義な特徴として出現する。
論文 参考訳(メタデータ) (2023-08-21T15:14:49Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。