論文の概要: Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database
- arxiv url: http://arxiv.org/abs/2409.01685v1
- Date: Tue, 3 Sep 2024 07:57:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 02:30:20.818729
- Title: Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database
- Title(参考訳): ICU心不全患者の死亡予測の最適化:XGBoostの活用とMIMIC-IIIデータベースによる高度な機械学習
- Authors: Negin Ashrafi, Armin Abdollahi, Jiahong Zhang, Maryam Pishgar,
- Abstract要約: 心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。
広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は、完全には理解されていない。
本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
- 参考スコア(独自算出の注目度): 1.5186937600119894
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Heart failure affects millions of people worldwide, significantly reducing quality of life and leading to high mortality rates. Despite extensive research, the relationship between heart failure and mortality rates among ICU patients is not fully understood, indicating the need for more accurate prediction models. This study analyzed data from 1,177 patients over 18 years old from the MIMIC-III database, identified using ICD-9 codes. Preprocessing steps included handling missing data, removing duplicates, treating skewness, and using oversampling techniques to address data imbalances. Through rigorous feature selection using Variance Inflation Factor (VIF), expert clinical input, and ablation studies, 46 key features were identified to enhance model performance. Our analysis compared several machine learning models, including Logistic Regression, Support Vector Machine (SVM), Random Forest, LightGBM, and XGBoost. XGBoost emerged as the superior model, achieving a test AUC-ROC of 0.9228 (95\% CI 0.8748 - 0.9613), significantly outperforming our previous work (AUC-ROC of 0.8766) and the best results reported in existing literature (AUC-ROC of 0.824). The improved model's success is attributed to advanced feature selection methods, robust preprocessing techniques, and comprehensive hyperparameter optimization through Grid-Search. SHAP analysis and feature importance evaluations based on XGBoost highlighted key variables like leucocyte count and RDW, providing valuable insights into the clinical factors influencing mortality risk. This framework offers significant support for clinicians, enabling them to identify high-risk ICU heart failure patients and improve patient outcomes through timely and informed interventions.
- Abstract(参考訳): 心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。
広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は完全には理解されておらず、より正確な予測モデルの必要性が示唆されている。
本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
前処理のステップには、欠落したデータの処理、重複の削除、歪の扱い、データの不均衡に対処するためのオーバーサンプリング技術の使用が含まれていた。
各種インフレーション因子 (VIF) を用いた厳密な特徴選択, 専門的臨床入力, アブレーション研究により, 46種類の重要な特徴が同定され, モデル性能が向上した。
分析では、ロジスティック回帰、サポートベクトルマシン(SVM)、ランダムフォレスト、LightGBM、XGBoostなど、いくつかの機械学習モデルを比較した。
XGBoost は AUC-ROC が 0.9228 (95\% CI 0.8748 - 0.9613) で, 先行研究 (AUC-ROC は 0.8766) と既存文献 (0.824) で報告された最良の結果に優れていた。
改良されたモデルの成功は、高度な特徴選択方法、堅牢な前処理技術、グリッドサーチによる包括的なハイパーパラメータ最適化によるものである。
XGBoostに基づくSHAP分析と特徴重要度評価では、白血球数やRDWなどの重要な変数が強調され、死亡リスクに影響を与える臨床的要因に関する貴重な洞察が得られた。
この枠組みは、高リスクICU心不全患者を同定し、タイムリーかつインフォメーションな介入を通じて患者の結果を改善できる、臨床医に重要な支援を提供する。
関連論文リスト
- MDS-ED: Multimodal Decision Support in the Emergency Department -- a Benchmark Dataset for Diagnoses and Deterioration Prediction in Emergency Medicine [0.9503773054285559]
我々は,MIMIC-IVに基づくデータセット,ベンチマークプロトコル,救急部門におけるマルチモーダル意思決定支援評価の初期結果を紹介する。
我々は、人口統計、バイオメトリックス、バイタルサイン、検査値、心電図波形など、最初の1.5時間からさまざまなデータモダリティを使用します。
診断モデルでは,AUROCスコアが0.8以上で,1428条件中357項目において統計的に有意なスコアが得られた。
論文 参考訳(メタデータ) (2024-07-25T08:21:46Z) - Advanced Predictive Modeling for Enhanced Mortality Prediction in ICU Stroke Patients Using Clinical Data [0.0]
ストロークは成人の障害と死亡の第二の要因である。
毎年1700万人が脳卒中を患っており、約85%が虚血性脳卒中である。
我々は、死亡リスクを評価するためのディープラーニングモデルを開発し、比較のためにいくつかのベースライン機械学習モデルを実装した。
論文 参考訳(メタデータ) (2024-07-19T11:17:42Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Explainable LightGBM Approach for Predicting Myocardial Infarction Mortality [0.0]
心筋梗塞は世界中で死亡の主な原因であり、患者の予後を改善するためには正確なリスク予測が不可欠である。
本稿では,データ前処理タスクの影響について検討し,木組化促進手法を3つ比較し,死亡リスクを予測した。
F1スコアが91,2%、データ前処理なしのLightGBMが91,8%であるのに対し、本手法は既存の機械学習手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-04-23T13:35:22Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Machine Learning Based Analytics for the Significance of Gait Analysis
in Monitoring and Managing Lower Extremity Injuries [0.0]
この研究は、合併症を予測する教師付き機械学習モデルの習熟度に焦点を当てた。
XGBoostはSMOTEの適用前後で最適なモデルであった。
この結果は、整形外科をデータインフォームドアプローチにシフトさせ、患者の結果を向上させるのに役立つ。
論文 参考訳(メタデータ) (2023-09-27T20:12:19Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Integrative Analysis for COVID-19 Patient Outcome Prediction [53.11258640541513]
我々は、集中治療室入院の必要性を予測するために、人口統計、バイタルサイン、実験室の所見から、肺不透明度の放射能と非画像の特徴を組み合わせる。
また, 地域性肺炎を含む他の肺疾患にも適用できるが, 地域性肺炎に限らない。
論文 参考訳(メタデータ) (2020-07-20T19:08:50Z) - Machine-Learning-Based Multiple Abnormality Prediction with Large-Scale
Chest Computed Tomography Volumes [64.21642241351857]
19,993症例から36,316巻の胸部CTデータセットを収集,解析した。
自由テキストラジオグラフィーレポートから異常ラベルを自動的に抽出するルールベース手法を開発した。
胸部CTボリュームの多臓器・多臓器分類モデルも開発した。
論文 参考訳(メタデータ) (2020-02-12T00:59:23Z) - Interpretable Machine Learning Model for Early Prediction of Mortality
in Elderly Patients with Multiple Organ Dysfunction Syndrome (MODS): a
Multicenter Retrospective Study and Cross Validation [9.808639780672156]
MODS患者は死亡リスクが高く予後不良である。
本研究は,MODS高齢者の早期死亡予測のための解釈可能・一般化可能なモデルを開発することを目的とする。
論文 参考訳(メタデータ) (2020-01-28T17:15:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。