論文の概要: Cardiovascular Disease Prediction using Machine Learning: A Comparative Analysis
- arxiv url: http://arxiv.org/abs/2507.21898v1
- Date: Tue, 29 Jul 2025 15:07:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:56.5543
- Title: Cardiovascular Disease Prediction using Machine Learning: A Comparative Analysis
- Title(参考訳): 機械学習を用いた心血管疾患の予測 : 比較分析
- Authors: Risshab Srinivas Ramesh, Roshani T S Udupa, Monisha J, Kushi K K S,
- Abstract要約: 本研究は、68,119レコードからなる心血管疾患(CVD)データセットに関するものである。
CVDと高齢者の強い関係を明らかにするため, t-tests, Chi-square test, ANOVAなどの統計分析を行った。
ロジスティック回帰モデルでは、年齢、血圧、コレステロールが主な危険因子であり、喫煙とアルコールの予期せぬ負の関連がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cardiovascular diseases (CVDs) are a main cause of mortality globally, accounting for 31% of all deaths. This study involves a cardiovascular disease (CVD) dataset comprising 68,119 records to explore the influence of numerical (age, height, weight, blood pressure, BMI) and categorical gender, cholesterol, glucose, smoking, alcohol, activity) factors on CVD occurrence. We have performed statistical analyses, including t-tests, Chi-square tests, and ANOVA, to identify strong associations between CVD and elderly people, hypertension, higher weight, and abnormal cholesterol levels, while physical activity (a protective factor). A logistic regression model highlights age, blood pressure, and cholesterol as primary risk factors, with unexpected negative associations for smoking and alcohol, suggesting potential data issues. Model performance comparisons reveal CatBoost as the top performer with an accuracy of 0.734 and an ECE of 0.0064 and excels in probabilistic prediction (Brier score = 0.1824). Data challenges, including outliers and skewed distributions, indicate a need for improved preprocessing to enhance predictive reliability.
- Abstract(参考訳): 心臓血管疾患(CVD)は、全世界で死亡する主な原因であり、全死亡の31%を占めている。
本研究は、68,119レコードからなる心血管疾患(CVD)データセットを用いて、数値(年齢、身長、体重、血圧、BMI)およびカテゴリー別性別、コレステロール、グルコース、喫煙、アルコール、活動)がCVDの発生に与える影響を調べた。
T-tests, Chi-square test, ANOVAなどの統計分析を行い, CVDと高齢者の強い関係, 高血圧, 高体重, 異常コレステロール値, 身体活動(保護因子)を同定した。
ロジスティック回帰モデルは、年齢、血圧、コレステロールを主要な危険因子として強調し、喫煙とアルコールの予期せぬ負の関連がデータの問題の可能性を示唆している。
モデル性能比較の結果、CataBoostは精度0.734、ECE0.0064であり、確率予測に優れていた(Brier score = 0.1824)。
外れ値や歪んだ分布を含むデータ課題は、予測信頼性を高めるための事前処理の改善の必要性を示している。
関連論文リスト
- Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Machine Learning-Based Model for Postoperative Stroke Prediction in Coronary Artery Disease [0.0]
本研究では,術後脳卒中リスクを評価するための高度な機械学習予測モデルを開発し,評価することを目的とする。
データセットには70%のトレーニングと30%のテストがあり、数値は正規化され、カテゴリ変数は1ホットエンコードされた。
ロジスティック回帰、XGBoost、SVM、CatBoostは予測モデルに使われ、SHAP分析は各変数のストロークリスクを評価した。
論文 参考訳(メタデータ) (2025-03-15T02:50:32Z) - Fuzzy Rule based Intelligent Cardiovascular Disease Prediction using Complex Event Processing [0.8668211481067458]
心血管疾患 (CVD) は、不健康な食事、身体活動の欠如、その他の要因により、急速に世界的な懸念が高まっている。
最近の研究は、リスクと死亡率を減らすための正確でタイムリーな病気予測に焦点を当てている。
本稿では,リアルタイム意思決定支援のためのファジィルールに基づく臨床データ監視システムを提案する。
論文 参考訳(メタデータ) (2024-09-19T16:36:24Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Improving Cardiovascular Disease Prediction Through Comparative Analysis
of Machine Learning Models: A Case Study on Myocardial Infarction [0.0]
心臓血管疾患は現代世界でも主要な死因である。
正確な予測は、医療戦略の精査に欠かせない。
XGBoostがトップパフォーマンスモデルとして登場します。
論文 参考訳(メタデータ) (2023-11-01T13:41:44Z) - Interpretable Survival Analysis for Heart Failure Risk Prediction [50.64739292687567]
現状の生存モデルと解釈可能かつ競合する新しい生存分析パイプラインを提案する。
我々のパイプラインは最先端のパフォーマンスを達成し、心不全のリスク要因に関する興味深い新しい洞察を提供する。
論文 参考訳(メタデータ) (2023-10-24T02:56:05Z) - Predicting blood pressure under circumstances of missing data: An
analysis of missing data patterns and imputation methods using NHANES [0.0]
CVDは、血圧の上昇、血糖の上昇、血液脂質の上昇、肥満によって影響を受ける。
貧困、ストレス、人種差別といった社会的・環境的な要因も重要な役割を担っている。
論文 参考訳(メタデータ) (2023-05-01T18:15:44Z) - Predicting adverse outcomes following catheter ablation treatment for
atrial fibrillation [2.202746751854349]
AFに対するカテーテルアブレーション治療後の予後予測モデルを構築した。
伝統的および深層生存モデルは、大きな出血、心不全、脳卒中、心停止、死の複合を予測するために訓練された。
論文 参考訳(メタデータ) (2022-11-22T02:55:51Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Robustness to Spurious Correlations via Human Annotations [100.63051542531171]
本稿では,人間に共通する因果関係の知識を活用して,素因関係に頑健なモデルを構築するための枠組みを提案する。
具体的には、人間のアノテーションを使用して、潜在的な未測定変数でトレーニング例を拡大する。
次に,未測定変数(UV-DRO)に対する分布性に頑健な新たな最適化手法を導入し,テスト時間シフトによる最悪の損失を制御する。
論文 参考訳(メタデータ) (2020-07-13T20:05:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。