論文の概要: Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database
- arxiv url: http://arxiv.org/abs/2409.01685v1
- Date: Tue, 3 Sep 2024 07:57:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 02:30:20.818729
- Title: Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database
- Title(参考訳): ICU心不全患者の死亡予測の最適化:XGBoostの活用とMIMIC-IIIデータベースによる高度な機械学習
- Authors: Negin Ashrafi, Armin Abdollahi, Jiahong Zhang, Maryam Pishgar,
- Abstract要約: 心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。
広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は、完全には理解されていない。
本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
- 参考スコア(独自算出の注目度): 1.5186937600119894
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Heart failure affects millions of people worldwide, significantly reducing quality of life and leading to high mortality rates. Despite extensive research, the relationship between heart failure and mortality rates among ICU patients is not fully understood, indicating the need for more accurate prediction models. This study analyzed data from 1,177 patients over 18 years old from the MIMIC-III database, identified using ICD-9 codes. Preprocessing steps included handling missing data, removing duplicates, treating skewness, and using oversampling techniques to address data imbalances. Through rigorous feature selection using Variance Inflation Factor (VIF), expert clinical input, and ablation studies, 46 key features were identified to enhance model performance. Our analysis compared several machine learning models, including Logistic Regression, Support Vector Machine (SVM), Random Forest, LightGBM, and XGBoost. XGBoost emerged as the superior model, achieving a test AUC-ROC of 0.9228 (95\% CI 0.8748 - 0.9613), significantly outperforming our previous work (AUC-ROC of 0.8766) and the best results reported in existing literature (AUC-ROC of 0.824). The improved model's success is attributed to advanced feature selection methods, robust preprocessing techniques, and comprehensive hyperparameter optimization through Grid-Search. SHAP analysis and feature importance evaluations based on XGBoost highlighted key variables like leucocyte count and RDW, providing valuable insights into the clinical factors influencing mortality risk. This framework offers significant support for clinicians, enabling them to identify high-risk ICU heart failure patients and improve patient outcomes through timely and informed interventions.
- Abstract(参考訳): 心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。
広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は完全には理解されておらず、より正確な予測モデルの必要性が示唆されている。
本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
前処理のステップには、欠落したデータの処理、重複の削除、歪の扱い、データの不均衡に対処するためのオーバーサンプリング技術の使用が含まれていた。
各種インフレーション因子 (VIF) を用いた厳密な特徴選択, 専門的臨床入力, アブレーション研究により, 46種類の重要な特徴が同定され, モデル性能が向上した。
分析では、ロジスティック回帰、サポートベクトルマシン(SVM)、ランダムフォレスト、LightGBM、XGBoostなど、いくつかの機械学習モデルを比較した。
XGBoost は AUC-ROC が 0.9228 (95\% CI 0.8748 - 0.9613) で, 先行研究 (AUC-ROC は 0.8766) と既存文献 (0.824) で報告された最良の結果に優れていた。
改良されたモデルの成功は、高度な特徴選択方法、堅牢な前処理技術、グリッドサーチによる包括的なハイパーパラメータ最適化によるものである。
XGBoostに基づくSHAP分析と特徴重要度評価では、白血球数やRDWなどの重要な変数が強調され、死亡リスクに影響を与える臨床的要因に関する貴重な洞察が得られた。
この枠組みは、高リスクICU心不全患者を同定し、タイムリーかつインフォメーションな介入を通じて患者の結果を改善できる、臨床医に重要な支援を提供する。
関連論文リスト
- Prediction of Lung Metastasis from Hepatocellular Carcinoma using the SEER Database [0.9055332067000195]
肝細胞癌(HCC)は、がん関連死亡の原因である。
HCCにおける肺転移の予測モデルは、範囲と臨床応用性に限られている。
本研究では,Surveillance, Epidemiology, End Results (SEER)データベースのデータを用いて,エンドツーエンドの機械学習パイプラインの開発と検証を行う。
論文 参考訳(メタデータ) (2025-01-20T20:06:31Z) - HIST-AID: Leveraging Historical Patient Reports for Enhanced Multi-Modal Automatic Diagnosis [38.13689106933105]
HIST-AIDは,過去の報告から自動診断精度を高めるフレームワークである。
AUROCは6.56%増加し、AUPRCは9.51%向上した。
論文 参考訳(メタデータ) (2024-11-16T03:20:53Z) - AIPatient: Simulating Patients with EHRs and LLM Powered Agentic Workflow [33.8495939261319]
本稿では,AIPatient Knowledge Graph (AIPatient KG) を入力とし,生成バックボーンとしてReasoning Retrieval-Augmented Generation (RAG) を開発した。
Reasoning RAGは、検索、KGクエリ生成、抽象化、チェッカー、書き直し、要約を含むタスクにまたがる6つのLLMエージェントを活用する。
ANOVA F-value 0.6126, p>0.1, ANOVA F-value 0.782, p>0.1, ANOVA F-value 0.782, p>0.1, ANOVA F-value 0.6126, p>0.1)。
論文 参考訳(メタデータ) (2024-09-27T17:17:15Z) - Data-Driven Machine Learning Approaches for Predicting In-Hospital Sepsis Mortality [0.0]
セプシスはアメリカ合衆国と世界中で多くの死者を負う重篤な状態である。
機械学習を用いたこれまでの研究では、特徴選択とモデル解釈可能性に制限があった。
本研究は,院内敗血症死亡率を予測するための,解釈可能かつ正確な機械学習モデルを開発することを目的とした。
論文 参考訳(メタデータ) (2024-08-03T00:28:25Z) - Enhanced Prediction of Ventilator-Associated Pneumonia in Patients with Traumatic Brain Injury Using Advanced Machine Learning Techniques [0.0]
外傷性脳損傷(TBI)患者の呼吸器関連肺炎(VAP)は重大な死亡リスクをもたらす。
TBI患者のVAPのタイムリーな検出と予後は、患者の予後を改善し、医療資源の負担を軽減するために重要である。
我々はMIMIC-IIIデータベースを用いて6つの機械学習モデルを実装した。
論文 参考訳(メタデータ) (2024-08-02T09:44:18Z) - Advanced Predictive Modeling for Enhanced Mortality Prediction in ICU Stroke Patients Using Clinical Data [0.0]
ストロークは成人の障害と死亡の第二の要因である。
毎年1700万人が脳卒中を患っており、約85%が虚血性脳卒中である。
我々は、死亡リスクを評価するためのディープラーニングモデルを開発し、比較のためにいくつかのベースライン機械学習モデルを実装した。
論文 参考訳(メタデータ) (2024-07-19T11:17:42Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - TACCO: Task-guided Co-clustering of Clinical Concepts and Patient Visits for Disease Subtyping based on EHR Data [42.96821770394798]
TACCOは、EMHデータのハイパーグラフモデリングに基づいて、臨床概念と患者訪問のクラスターを共同で発見する新しいフレームワークである。
我々は,表現型分類と心血管リスク予測の下流臨床課題に対して,公共MIMIC-IIIデータセットとエモリー内部CRADLEデータセットを用いて実験を行った。
深層モデル解析,クラスタリング結果解析,臨床ケーススタディは,TACCOが提供した改良されたユーティリティと洞察に富んだ解釈をさらに検証する。
論文 参考訳(メタデータ) (2024-06-14T14:18:38Z) - Explainable LightGBM Approach for Predicting Myocardial Infarction Mortality [0.0]
心筋梗塞は世界中で死亡の主な原因であり、患者の予後を改善するためには正確なリスク予測が不可欠である。
本稿では,データ前処理タスクの影響について検討し,木組化促進手法を3つ比較し,死亡リスクを予測した。
F1スコアが91,2%、データ前処理なしのLightGBMが91,8%であるのに対し、本手法は既存の機械学習手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-04-23T13:35:22Z) - Penalized Deep Partially Linear Cox Models with Application to CT Scans
of Lung Cancer Patients [42.09584755334577]
肺がんは世界中のがん死亡の原因であり、効果的な治療法を設計するための死亡リスクを理解することの重要性を強調している。
NLST(National Lung Screening Trial)は、肺がん患者の死亡リスクを定量化するために、CTテクスチャ解析を用いている。
本稿では,SCADペナルティを組み込んで重要なテクスチャ特徴を抽出し,深層ニューラルネットワークを用いてモデルの非パラメトリック成分を推定する,Pentalized Deep partially Linear Cox Model (Penalized DPLC)を提案する。
論文 参考訳(メタデータ) (2023-03-09T15:38:16Z) - Deep-Learning Tool for Early Identifying Non-Traumatic Intracranial
Hemorrhage Etiology based on CT Scan [40.51754649947294]
深層学習モデルは、2011年1月から2018年4月までに収集された非外傷性ICHを用いた1868個のNCCTスキャンを用いて開発された。
診断成績は臨床医の成績と比較した。
臨床医は, システム拡張による特定の出血エチオロジーの感度, 特異性, 精度を著しく改善した。
論文 参考訳(メタデータ) (2023-02-02T08:45:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。