論文の概要: A Comparative Study of Diabetes Prediction Based on Lifestyle Factors Using Machine Learning
- arxiv url: http://arxiv.org/abs/2503.04137v1
- Date: Thu, 06 Mar 2025 06:31:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 17:59:00.694807
- Title: A Comparative Study of Diabetes Prediction Based on Lifestyle Factors Using Machine Learning
- Title(参考訳): 機械学習を用いたライフスタイル因子に基づく糖尿病予測の比較検討
- Authors: Bruce Nguyen, Yan Zhang,
- Abstract要約: 本研究では,BRFSS(Behavimental Risk Factor Surveillance System)の2015年調査から得られたデータを用いて,生活習慣要因に基づく糖尿病の予測に機械学習モデルを用いることを検討した。
決定木(Decision Tree)、K-Nearest Neighbors(KNN)、ロジスティック回帰(Logistic Regression)の3つの分類モデルを実装し,その予測性能を評価する。
その結果、決定木、KNN、ロジスティック回帰はそれぞれ0.74、0.72、0.75の精度を達成し、精度とリコールの強さは様々であった。
- 参考スコア(独自算出の注目度): 2.767257448554864
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Diabetes is a prevalent chronic disease with significant health and economic burdens worldwide. Early prediction and diagnosis can aid in effective management and prevention of complications. This study explores the use of machine learning models to predict diabetes based on lifestyle factors using data from the Behavioral Risk Factor Surveillance System (BRFSS) 2015 survey. The dataset consists of 21 lifestyle and health-related features, capturing aspects such as physical activity, diet, mental health, and socioeconomic status. Three classification models, Decision Tree, K-Nearest Neighbors (KNN), and Logistic Regression, are implemented and evaluated to determine their predictive performance. The models are trained and tested using a balanced dataset, and their performances are assessed based on accuracy, precision, recall, and F1-score. The results indicate that the Decision Tree, KNN, and Logistic Regression achieve an accuracy of 0.74, 0.72, and 0.75, respectively, with varying strengths in precision and recall. The findings highlight the potential of machine learning in diabetes prediction and suggest future improvements through feature selection and ensemble learning techniques.
- Abstract(参考訳): 糖尿病は世界中で深刻な健康と経済的負担を伴う慢性疾患である。
早期の予測と診断は、合併症の効果的な管理と予防に役立つ。
本研究では,BRFSS(Behavimental Risk Factor Surveillance System)の2015年調査から得られたデータを用いて,生活習慣要因に基づく糖尿病の予測に機械学習モデルを用いることを検討した。
このデータセットは21のライフスタイルと健康関連の特徴で構成され、身体活動、食事、メンタルヘルス、社会経済状態などの側面を捉えている。
決定木(Decision Tree)、K-Nearest Neighbors(KNN)、ロジスティック回帰(Logistic Regression)の3つの分類モデルを実装し,その予測性能を評価する。
モデルはバランスの取れたデータセットを使用してトレーニングとテストが行われ、そのパフォーマンスは精度、精度、リコール、F1スコアに基づいて評価される。
その結果、決定木、KNN、ロジスティック回帰はそれぞれ0.74、0.72、0.75の精度を達成し、精度とリコールの強さは様々であった。
この結果は、糖尿病予測における機械学習の可能性を強調し、特徴選択とアンサンブル学習技術による将来の改善を提案する。
関連論文リスト
- Chronic Diseases Prediction using Machine Learning and Deep Learning Methods [0.0]
本研究は,慢性疾患および甲状腺疾患の予測に機械学習(ML)およびディープラーニング(DL)技術の応用について検討した。
我々は、ロジスティック回帰(LR)、ランダムフォレスト(RF)、グラディエントブーストツリー(GBT)、ニューラルネットワーク(NN)、決定木(DT)、ネイティブベイズ(NB)など、さまざまなモデルを使用した。
その結果、ランダムフォレストやグラディエントブーストツリーのようなアンサンブル手法は一貫して優れていた。
論文 参考訳(メタデータ) (2025-04-30T21:08:16Z) - Feature-Enhanced Machine Learning for All-Cause Mortality Prediction in Healthcare Data [0.0]
本研究は,MIMIC-IIIデータベースを用いた全病院死亡予測のための機械学習モデルを評価する。
我々は,バイタルサイン(心拍数,血圧など),実験結果,人口統計情報などの重要な特徴を抽出した。
ランダムフォレストモデルは、AUCの0.94で最高性能を達成し、他の機械学習やディープラーニングのアプローチを著しく上回った。
論文 参考訳(メタデータ) (2025-03-27T08:04:42Z) - Towards Transparent and Accurate Diabetes Prediction Using Machine Learning and Explainable Artificial Intelligence [8.224338294959699]
本研究では機械学習モデルとXAIツールを用いた糖尿病予測の枠組みを提案する。
アンサンブルモデルは精度が高く、テスト精度は92.50%、ROC-AUCは0.975であった。
その結果、XAIと組み合わせたMLは、医療システムで使用する正確で計算学的に透過的なツールを開発するための有望な手段であることが示唆された。
論文 参考訳(メタデータ) (2025-01-30T00:42:43Z) - From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [47.23780364438969]
本稿では,CGMデータの生成基盤モデルであるGluFormerについて紹介する。
GluFormerは、異なる民族や年齢、5つの国、8つのCGMデバイス、多様な病態状態にまたがる19の外部コホートに一般化する。
CGMデータと12年間のフォローアップを持つ580人の成人の縦断的研究において、GluFormerは血液HbA1C%よりも糖尿病を効果的に発症するリスクが高い個人を特定する。
論文 参考訳(メタデータ) (2024-08-20T13:19:06Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Foresight -- Deep Generative Modelling of Patient Timelines using
Electronic Health Records [46.024501445093755]
医学史の時間的モデリングは、将来の出来事を予測し、シミュレートしたり、リスクを見積り、代替診断を提案したり、合併症を予測するために使用することができる。
我々は、文書テキストを構造化されたコード化された概念に変換するためにNER+Lツール(MedCAT)を使用する新しいGPT3ベースのパイプラインであるForesightを提示する。
論文 参考訳(メタデータ) (2022-12-13T19:06:00Z) - Secure and Privacy-Preserving Automated Machine Learning Operations into
End-to-End Integrated IoT-Edge-Artificial Intelligence-Blockchain Monitoring
System for Diabetes Mellitus Prediction [0.5825410941577593]
本稿では,危険因子に基づく糖尿病予測のためのIoT-edge-Artificial Intelligence (AI)-blockchainシステムを提案する。
提案システムはブロックチェーンによって支えられ、異なる病院の患者からリスクファクターデータの密集したビューを得る。
提案システムでは,最も正確なランダム林モデルを用いて,数値実験と比較解析を行った。
論文 参考訳(メタデータ) (2022-11-13T13:57:14Z) - Improvement of a Prediction Model for Heart Failure Survival through
Explainable Artificial Intelligence [0.0]
本研究は、心不全生存予測モデルの説明可能性分析と評価について述べる。
このモデルでは、最高のアンサンブルツリーアルゴリズムを選択できるデータワークフローパイプラインと、最高の機能選択テクニックが採用されている。
本論文の主な貢献は、精度-説明可能性バランスに基づいて、HF生存率の最良の予測モデルを選択するための説明可能性駆動型アプローチである。
論文 参考訳(メタデータ) (2021-08-20T09:03:26Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - Short Term Blood Glucose Prediction based on Continuous Glucose
Monitoring Data [53.01543207478818]
本研究では,デジタル意思決定支援ツールの入力として連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データを利用する方法について検討する。
短時間の血液グルコース (STBG) 予測において, リカレントニューラルネットワーク (Recurrent Neural Networks, RNN) をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2020-02-06T16:39:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。