論文の概要: Optimizing Stroke Risk Prediction: A Machine Learning Pipeline Combining ROS-Balanced Ensembles and XAI
- arxiv url: http://arxiv.org/abs/2512.01333v1
- Date: Mon, 01 Dec 2025 06:53:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.720534
- Title: Optimizing Stroke Risk Prediction: A Machine Learning Pipeline Combining ROS-Balanced Ensembles and XAI
- Title(参考訳): ストロークリスク予測の最適化 - ROSベースのアンサンブルとXAIを組み合わせた機械学習パイプライン
- Authors: A S M Ahsanul Sarkar Akib, Raduana Khawla, Abdul Hasib,
- Abstract要約: ストロークは死と恒久的な障害の主な原因であり、世界的な健康上の問題となっている。
この課題に対処するために、私たちはアンサンブルモデリングと説明可能なAI(XAI)技術を使用して、脳卒中リスク予測のための解釈可能な機械学習フレームワークを作成しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stroke is a major cause of death and permanent impairment, making it a major worldwide health concern. For prompt intervention and successful preventative tactics, early risk assessment is essential. To address this challenge, we used ensemble modeling and explainable AI (XAI) techniques to create an interpretable machine learning framework for stroke risk prediction. A thorough evaluation of 10 different machine learning models using 5-fold cross-validation across several datasets was part of our all-inclusive strategy, which also included feature engineering and data pretreatment (using Random Over-Sampling (ROS) to solve class imbalance). Our optimized ensemble model (Random Forest + ExtraTrees + XGBoost) performed exceptionally well, obtaining a strong 99.09% accuracy on the Stroke Prediction Dataset (SPD). We improved the model's transparency and clinical applicability by identifying three important clinical variables using LIME-based interpretability analysis: age, hypertension, and glucose levels. Through early prediction, this study highlights how combining ensemble learning with explainable AI (XAI) can deliver highly accurate and interpretable stroke risk assessment. By enabling data-driven prevention and personalized clinical decisions, our framework has the potential to transform stroke prediction and cardiovascular risk management.
- Abstract(参考訳): ストロークは死と恒久的な障害の主な原因であり、世界的な健康上の問題となっている。
迅速な介入と予防戦略の成功のためには、早期リスク評価が不可欠である。
この課題に対処するために、私たちはアンサンブルモデリングと説明可能なAI(XAI)技術を使用して、脳卒中リスク予測のための解釈可能な機械学習フレームワークを作成しました。
複数のデータセットをまたいだ5倍のクロスバリデーションを用いた10種類の機械学習モデルの徹底的な評価は、機能エンジニアリングとデータ前処理(クラス不均衡を解決するためにRandom Over-Sampling(ROS)を使用して)を含む包括的な戦略の一部でした。
最適化されたアンサンブルモデル (Random Forest + ExtraTrees + XGBoost) は、Stroke Prediction Dataset (SPD) において、99.09%の精度を得ることができた。
LIMEに基づく解釈可能性分析により, 年齢, 高血圧, 血糖値の3つの重要な臨床変数を同定し, モデルの透明性と臨床応用性を改善した。
この研究は、早期予測を通じて、アンサンブル学習と説明可能なAI(XAI)を組み合わせることで、高精度で解釈可能な脳卒中リスク評価を実現する方法について強調する。
データ駆動型予防とパーソナライズされた臨床決定を可能にすることで、脳卒中予測と心血管リスク管理を変革する可能性がある。
関連論文リスト
- Benchmarking Foundation Models and Parameter-Efficient Fine-Tuning for Prognosis Prediction in Medical Imaging [40.35825564674249]
本研究では,基礎モデルにおける伝達学習戦略の堅牢性と効率性を評価するための最初の構造化されたベンチマークを紹介する。
新型コロナウイルス(COVID-19)の胸部X線データセットが4つ使用されており、死亡率、重症度、入院率をカバーしている。
一般またはバイオメディカルデータセットで事前訓練されたImageNetとFMで事前訓練されたCNNは、完全な微調整、線形探索、パラメータ効率のよい手法を用いて適応された。
論文 参考訳(メタデータ) (2025-06-23T09:16:04Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Comparative Analysis of Stroke Prediction Models Using Machine Learning [0.0]
ストロークはいまだに世界的健康上の最も重要な課題の1つであり、世界第2位の死因であり、世界第3位の障害の原因である。
本研究では、ストローク予測データセットから、人口統計データ、臨床データ、ライフスタイルデータを用いて、脳卒中リスクを予測する機械学習アルゴリズムの有効性を検討する。
論文 参考訳(メタデータ) (2025-05-14T21:27:19Z) - Deciphering Cardiac Destiny: Unveiling Future Risks Through Cutting-Edge Machine Learning Approaches [0.0]
本研究の目的は,心停止事故のタイムリー同定のための予測モデルの開発と評価である。
我々は、XGBoost、Gradient Boosting、Naive Bayesといった機械学習アルゴリズムと、リカレントニューラルネットワーク(RNN)によるディープラーニング(DL)アプローチを採用しています。
厳密な実験と検証により,RNNモデルの優れた性能が示された。
論文 参考訳(メタデータ) (2024-09-03T19:18:16Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Analysis and Evaluation of Explainable Artificial Intelligence on
Suicide Risk Assessment [32.04382293817763]
本研究では,自殺リスク予測における説明可能な人工知能(XAI)技術の有効性について検討した。
データ拡張技術とMLモデルは、関連するリスクを予測するために使用される。
高い収入、高い職業、大学教育を持つ患者は、最もリスクが低い。
論文 参考訳(メタデータ) (2023-03-09T05:11:46Z) - A New Approach for Interpretability and Reliability in Clinical Risk
Prediction: Acute Coronary Syndrome Scenario [0.33927193323747895]
我々は、リスクスコアと機械学習モデルの両方の最高の特徴を組み合わせた、新たなリスクアセスメント方法論を作成するつもりです。
提案手法は、標準LRと同一の試験結果を得たが、より優れた解釈性とパーソナライゼーションを提供する。
個人予測の信頼性推定は誤分類率と大きな相関を示した。
論文 参考訳(メタデータ) (2021-10-15T19:33:46Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。