論文の概要: A data balancing approach towards design of an expert system for Heart Disease Prediction
- arxiv url: http://arxiv.org/abs/2407.18606v2
- Date: Mon, 29 Jul 2024 10:22:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 12:35:35.313927
- Title: A data balancing approach towards design of an expert system for Heart Disease Prediction
- Title(参考訳): 心疾患予測エキスパートシステムの設計に向けたデータバランシングアプローチ
- Authors: Rahul Karmakar, Udita Ghosh, Arpita Pal, Sattwiki Dey, Debraj Malik, Priyabrata Sain,
- Abstract要約: 心臓病は深刻な世界的な健康問題で、毎年何百万人もの命がかかっています。
本稿では,決定木(DT),ランダムフォレスト(RF),線形判別分析,エクストラツリーブースト,アダブーストという5つの機械学習手法を用いた。
ランダムフォレストと決定木モデルの精度は99.83%だった。
- 参考スコア(独自算出の注目度): 0.9895793818721335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Heart disease is a serious global health issue that claims millions of lives every year. Early detection and precise prediction are critical to the prevention and successful treatment of heart related issues. A lot of research utilizes machine learning (ML) models to forecast cardiac disease and obtain early detection. In order to do predictive analysis on "Heart disease health indicators " dataset. We employed five machine learning methods in this paper: Decision Tree (DT), Random Forest (RF), Linear Discriminant Analysis, Extra Tree Classifier, and AdaBoost. The model is further examined using various feature selection (FS) techniques. To enhance the baseline model, we have separately applied four FS techniques: Sequential Forward FS, Sequential Backward FS, Correlation Matrix, and Chi2. Lastly, K means SMOTE oversampling is applied to the models to enable additional analysis. The findings show that when it came to predicting heart disease, ensemble approaches in particular, random forests performed better than individual classifiers. The presence of smoking, blood pressure, cholesterol, and physical inactivity were among the major predictors that were found. The accuracy of the Random Forest and Decision Tree model was 99.83%. This paper demonstrates how machine learning models can improve the accuracy of heart disease prediction, especially when using ensemble methodologies. The models provide a more accurate risk assessment than traditional methods since they incorporate a large number of factors and complex algorithms.
- Abstract(参考訳): 心臓病は深刻な世界的な健康問題で、毎年何百万人もの命がかかっています。
早期発見と正確な予測は、心疾患の予防と治療の成功に不可欠である。
多くの研究は、機械学習(ML)モデルを用いて心臓疾患を予測し、早期発見を得る。
心臓病の健康指標」データセットの予測分析を行う。
本稿では,決定木(DT),ランダムフォレスト(RF),線形判別分析,木外分類器,AdaBoostの5つの機械学習手法を用いた。
さらに,様々な特徴選択(FS)技術を用いて検討した。
ベースラインモデルを強化するために,Sequential Forward FS,Sequential Backward FS,Relation Matrix,Chi2の4つのFS手法を別々に適用した。
最後に、K は SMOTE オーバーサンプリングをモデルに適用し、さらなる分析を可能にすることを意味する。
その結果、心疾患の予測に際し、特にアンサンブルアプローチでは、個々の分類器よりもランダムな森林の方が優れた結果が得られた。
喫煙,血圧,コレステロール,身体的不活性の存在が主要な予測因子の1つであった。
ランダムフォレストと決定木モデルの精度は99.83%だった。
本稿では,特にアンサンブル法を用いて,機械学習モデルが心疾患予測の精度を向上させる方法を示す。
モデルは、多数の要因と複雑なアルゴリズムを組み込んでいるため、従来の方法よりも正確なリスク評価を提供する。
関連論文リスト
- Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Predictive Modeling for Breast Cancer Classification in the Context of Bangladeshi Patients: A Supervised Machine Learning Approach with Explainable AI [0.0]
5種類の機械学習手法の分類精度,精度,リコール,F-1スコアを評価し,比較した。
XGBoostは97%という最高のモデル精度を達成した。
論文 参考訳(メタデータ) (2024-04-06T17:23:21Z) - Interpretable Survival Analysis for Heart Failure Risk Prediction [50.64739292687567]
現状の生存モデルと解釈可能かつ競合する新しい生存分析パイプラインを提案する。
我々のパイプラインは最先端のパフォーマンスを達成し、心不全のリスク要因に関する興味深い新しい洞察を提供する。
論文 参考訳(メタデータ) (2023-10-24T02:56:05Z) - Deep Reinforcement Learning Framework for Thoracic Diseases
Classification via Prior Knowledge Guidance [49.87607548975686]
関連疾患に対するラベル付きデータの不足は、正確な診断にとって大きな課題となる。
本稿では,診断エージェントの学習を指導するための事前知識を導入する,新しい深層強化学習フレームワークを提案する。
提案手法の性能はNIHX-ray 14とCheXpertデータセットを用いて実証した。
論文 参考訳(メタデータ) (2023-06-02T01:46:31Z) - An Improved Heart Disease Prediction Using Stacked Ensemble Method [0.9187159782788579]
機械学習を用いた心疾患予測システムを構築した。
心臓疾患のある人と正常な人とを簡単に区別することができる。
論文 参考訳(メタデータ) (2023-04-12T17:53:59Z) - Survival Prediction of Heart Failure Patients using Stacked Ensemble
Machine Learning Algorithm [0.0]
心不全は、我々の時代における主要な健康上の危険問題の1つであり、世界中の死因の1つです。
データマイニングは、医療機関が生成した大量の生データを意味のある情報に変換するプロセスである。
本研究は, 心不全後の生存可能性を予測するためには, 患者から採取した特定の属性のみが必須であることが示唆された。
論文 参考訳(メタデータ) (2021-08-30T16:42:27Z) - Improvement of a Prediction Model for Heart Failure Survival through
Explainable Artificial Intelligence [0.0]
本研究は、心不全生存予測モデルの説明可能性分析と評価について述べる。
このモデルでは、最高のアンサンブルツリーアルゴリズムを選択できるデータワークフローパイプラインと、最高の機能選択テクニックが採用されている。
本論文の主な貢献は、精度-説明可能性バランスに基づいて、HF生存率の最良の予測モデルを選択するための説明可能性駆動型アプローチである。
論文 参考訳(メタデータ) (2021-08-20T09:03:26Z) - Novel Deep Learning Architecture for Heart Disease Prediction using
Convolutional Neural Network [0.0]
心臓病は、世界中の多くの人々の生活を妨げる最も致命的な病気の1つである。
本稿では,健康な人と非健康な人の分類に1次元畳み込みニューラルネットワークを用いた新しいディープラーニングアーキテクチャを提案する。
提案するネットワークは、データセット上で97%以上のトレーニング精度と96%のテスト精度を達成する。
論文 参考訳(メタデータ) (2021-05-22T22:00:57Z) - RA-GCN: Graph Convolutional Network for Disease Prediction Problems with
Imbalanced Data [47.00510780034136]
クラス不均衡は疾患予測の分野でよく知られた問題である。
本稿では,グラフベースの分類器の性能を高めるために,Re-weighted Adversarial Graph Convolutional Network (RA-GCN)を提案する。
本研究では,ra-gcnの合成および3種類の医療用データセットに対する優越性を示す。
論文 参考訳(メタデータ) (2021-02-27T14:06:27Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。