論文の概要: Feature selection strategies for optimized heart disease diagnosis using ML and DL models
- arxiv url: http://arxiv.org/abs/2503.16577v1
- Date: Thu, 20 Mar 2025 09:59:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 15:40:10.127337
- Title: Feature selection strategies for optimized heart disease diagnosis using ML and DL models
- Title(参考訳): MLモデルとDLモデルを用いた心臓疾患の最適診断のための特徴選択法
- Authors: Bilal Ahmad, Jinfu Chen, Haibao Chen,
- Abstract要約: 本研究では,様々な機械学習(ML)モデルとディープラーニング(DL)モデルの予測性能に及ぼす特徴選択手法の影響を評価する。
11種類のML/DLモデルを精度,リコール,AUCスコア,F1スコア,精度などの指標を用いて評価した。
結果は、特にニューラルネットワークのような高度なモデルにおいて、MIが他の手法よりも優れていたことを示している。
- 参考スコア(独自算出の注目度): 4.863856267150165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Heart disease remains one of the leading causes of morbidity and mortality worldwide, necessitating the development of effective diagnostic tools to enable early diagnosis and clinical decision-making. This study evaluates the impact of feature selection techniques Mutual Information (MI), Analysis of Variance (ANOVA), and Chi-Square on the predictive performance of various machine learning (ML) and deep learning (DL) models using a dataset of clinical indicators for heart disease. Eleven ML/DL models were assessed using metrics such as precision, recall, AUC score, F1-score, and accuracy. Results indicate that MI outperformed other methods, particularly for advanced models like neural networks, achieving the highest accuracy of 82.3% and recall score of 0.94. Logistic regression (accuracy 82.1%) and random forest (accuracy 80.99%) also demonstrated improved performance with MI. Simpler models such as Naive Bayes and decision trees achieved comparable results with ANOVA and Chi-Square, yielding accuracies of 76.45% and 75.99%, respectively, making them computationally efficient alternatives. Conversely, k Nearest Neighbors (KNN) and Support Vector Machines (SVM) exhibited lower performance, with accuracies ranging between 51.52% and 54.43%, regardless of the feature selection method. This study provides a comprehensive comparison of feature selection methods for heart disease prediction, demonstrating the critical role of feature selection in optimizing model performance. The results offer practical guidance for selecting appropriate feature selection techniques based on the chosen classification algorithm, contributing to the development of more accurate and efficient diagnostic tools for enhanced clinical decision-making in cardiology.
- Abstract(参考訳): 心臓病は世界中で致死率と死亡率の主要な原因の1つであり、早期診断と臨床的意思決定を可能にする効果的な診断ツールの開発が必要である。
本研究では,Multual Information (MI), Analysis of Variance (ANOVA), and Chi-Squareが各種機械学習(ML)モデルおよび深層学習(DL)モデルの心疾患に対する臨床指標のデータセットを用いて予測性能に与える影響を評価する。
11種類のML/DLモデルを精度,リコール,AUCスコア,F1スコア,精度などの指標を用いて評価した。
結果は、特にニューラルネットワークのような高度なモデルではMIが他の手法よりも優れており、82.3%、リコールスコア0.94を達成していることを示している。
ロジスティック回帰(精度82.1%)とランダム森林(80.99%)もMIの性能改善を示した。
Naive Bayes や decision tree のような単純なモデルは ANOVA と Chi-Square で同等の結果を出し、それぞれ76.45% と 75.99% の精度で計算効率の良い代替品が得られた。
逆に k Nearest Neighbors (KNN) と Support Vector Machines (SVM) は、特徴の選択方法にかかわらず、51.52%から54.43%の精度で低い性能を示した。
本研究は、心疾患予測のための特徴選択法を総合的に比較し、モデル性能の最適化における特徴選択の重要性を実証する。
その結果、選択した分類アルゴリズムに基づいて適切な特徴選択手法を選択するための実践的ガイダンスが得られ、より正確で効率的な診断ツールの開発に寄与する。
関連論文リスト
- Enhancing stroke disease classification through machine learning models via a novel voting system by feature selection techniques [1.2302586529345994]
心臓病は世界中で致死率と死亡率の主要な原因である。
我々は,心臓病の分類を高度化するための特徴選択技術を備えた新しい投票システムを開発した。
XGBoostは、99%の精度、F1スコア、98%のリコール、100%のROC AUCを達成した。
論文 参考訳(メタデータ) (2025-04-01T07:16:49Z) - Advancements In Heart Disease Prediction: A Machine Learning Approach For Early Detection And Risk Assessment [0.0]
本稿では,臨床データを用いた心疾患のリスク予測における機械学習モデルの役割,関連性,効率性を理解し,評価し,分析する。
Support Vector Machine (SVM) は91.51%の精度を示し、予測能力の観点から評価されたモデル間にその優位性を確認している。
論文 参考訳(メタデータ) (2024-10-16T22:32:19Z) - Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database [1.5186937600119894]
心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。
広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は、完全には理解されていない。
本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
論文 参考訳(メタデータ) (2024-09-03T07:57:08Z) - Two new feature selection methods based on learn-heuristic techniques for breast cancer prediction: A comprehensive analysis [6.796017024594715]
帝国主義競争アルゴリズム(ICA)とバットアルゴリズム(BA)に基づく2つの新しい特徴選択法を提案する。
本研究は, 診断モデルの効率を向上し, 臨床医師がこれまでよりもはるかに正確かつ信頼性の高い意思決定を行えるよう包括的分析を行うことを目的とする。
論文 参考訳(メタデータ) (2024-07-19T19:07:53Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - AXIAL: Attention-based eXplainability for Interpretable Alzheimer's Localized Diagnosis using 2D CNNs on 3D MRI brain scans [43.06293430764841]
本研究では,3次元MRIを用いたアルツハイマー病診断の革新的手法を提案する。
提案手法では,2次元CNNがボリューム表現を抽出できるソフトアテンション機構を採用している。
ボクセルレベルの精度では、どの領域に注意が払われているかを同定し、これらの支配的な脳領域を同定する。
論文 参考訳(メタデータ) (2024-07-02T16:44:00Z) - Evaluating Echo State Network for Parkinson's Disease Prediction using
Voice Features [1.2289361708127877]
本研究の目的は,偽陰性の最小化と高精度化を両立できる診断モデルを開発することである。
Echo State Networks (ESN)、Random Forest、k-nearest Neighbors、Support Vector、Extreme Gradient Boosting、Decision Treeなど、さまざまな機械学習手法が採用され、徹底的に評価されている。
ESNは83%の症例で8%未満の偽陰性率を維持している。
論文 参考訳(メタデータ) (2024-01-28T14:39:43Z) - Deep-Learning Tool for Early Identifying Non-Traumatic Intracranial
Hemorrhage Etiology based on CT Scan [40.51754649947294]
深層学習モデルは、2011年1月から2018年4月までに収集された非外傷性ICHを用いた1868個のNCCTスキャンを用いて開発された。
診断成績は臨床医の成績と比較した。
臨床医は, システム拡張による特定の出血エチオロジーの感度, 特異性, 精度を著しく改善した。
論文 参考訳(メタデータ) (2023-02-02T08:45:17Z) - Comparison of Machine Learning Classifiers to Predict Patient Survival
and Genetics of GBM: Towards a Standardized Model for Clinical Implementation [44.02622933605018]
放射線モデルは、グリオ芽腫(GBM)の結果予測のための臨床データを上回ることが示されています。
GBM患者の生存率(OS),IDH変異,O-6-メチルグアニン-DNA-メチルトランスフェラーゼ(MGMT)プロモーターメチル化,EGFR(EGFR)VII増幅,Ki-67発現の9種類の機械学習分類器を比較した。
xgb は os (74.5%), ab for idh 変異 (88%), mgmt メチル化 (71,7%), ki-67 発現 (86,6%), egfr増幅 (81。
論文 参考訳(メタデータ) (2021-02-10T15:10:37Z) - Identification of Ischemic Heart Disease by using machine learning
technique based on parameters measuring Heart Rate Variability [50.591267188664666]
本研究は,243名の非侵襲的特徴(年齢,性別,左室容積率,HRV15)を用いて,一連のANNの訓練と評価を行った。
最高の結果は、7つの入力パラメータと7つの隠れノードを使用して、トレーニングと検証データセットに対して98.9%と82%の精度で得られた。
論文 参考訳(メタデータ) (2020-10-29T19:14:41Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。