論文の概要: An Improved Ensemble-Based Machine Learning Model with Feature Optimization for Early Diabetes Prediction
- arxiv url: http://arxiv.org/abs/2512.02023v1
- Date: Sat, 15 Nov 2025 07:42:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.41305
- Title: An Improved Ensemble-Based Machine Learning Model with Feature Optimization for Early Diabetes Prediction
- Title(参考訳): 早期糖尿病予測のための特徴最適化を用いた組立型機械学習モデルの改良
- Authors: Md. Najmul Islam, Md. Miner Hossain Rimon, Shah Sadek-E-Akbor Shamim, Zarif Mohaimen Fahad, Md. Jehadul Islam Mony, Md. Jalal Uddin Chowdhury,
- Abstract要約: 糖尿病は世界中で深刻な健康問題であり、早期発見に依存している。
広範囲にわたる健康調査データを用いて、正確かつ理解可能な糖尿病分類のための機械学習フレームワークを作成する。
本研究では,早期糖尿病予測をサポートするために,Python Flaskバックエンドを備えたReact Nativeベースのアプリケーションを提案し,開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diabetes is a serious worldwide health issue, and successful intervention depends on early detection. However, overlapping risk factors and data asymmetry make prediction difficult. To use extensive health survey data to create a machine learning framework for diabetes classification that is both accurate and comprehensible, to produce results that will aid in clinical decision-making. Using the BRFSS dataset, we assessed a number of supervised learning techniques. SMOTE and Tomek Links were used to correct class imbalance. To improve prediction performance, both individual models and ensemble techniques such as stacking were investigated. The 2015 BRFSS dataset, which includes roughly 253,680 records with 22 numerical features, is used in this study. Strong ROC-AUC performance of approximately 0.96 was attained by the individual models Random Forest, XGBoost, CatBoost, and LightGBM.The stacking ensemble with XGBoost and KNN yielded the best overall results with 94.82\% accuracy, ROC-AUC of 0.989, and PR-AUC of 0.991, indicating a favourable balance between recall and precision. In our study, we proposed and developed a React Native-based application with a Python Flask backend to support early diabetes prediction, providing users with an accessible and efficient health monitoring tool.
- Abstract(参考訳): 糖尿病は世界中で深刻な健康問題であり、早期発見に依存している。
しかし、重なり合うリスク要因とデータ非対称性は予測を難しくする。
広範な健康調査データを用いて、正確かつ理解可能な糖尿病分類のための機械学習フレームワークを作成し、臨床意思決定に役立つ結果を生成する。
BRFSSデータセットを用いて,教師あり学習手法の評価を行った。
SMOTEとTomek Linksはクラス不均衡の修正に使用された。
予測性能を向上させるため,個々のモデルと積み重ねなどのアンサンブル技術について検討した。
2015年のBRFSSデータセットは、22の数値特徴を持つ約253,680のレコードを含む。
ROC-AUCのパフォーマンスは約0.96で、Random Forest、XGBoost、CatBoost、LightGBMの各モデルで達成され、XGBoostとKNNによる積み重ねアンサンブルは94.82\%、ROC-AUCは0.989、PR-AUCは0.991で、リコールと精度のバランスが良好であった。
本研究では,早期糖尿病予測をサポートするために,Python Flaskバックエンドを備えたReact Nativeベースのアプリケーションを提案し,開発した。
関連論文リスト
- Validating Vision Transformers for Otoscopy: Performance and Data-Leakage Effects [42.465094107111646]
本研究では、耳疾患の診断精度を高めるために、視覚トランスモデル、特にスウィントランスモデルの有効性を評価する。
この研究はチリ大学臨床病院の耳鼻咽喉科の実際のデータセットを利用した。
論文 参考訳(メタデータ) (2025-11-06T23:20:37Z) - Predicting Diabetic Retinopathy Using a Two-Level Ensemble Model [0.6445605125467574]
糖尿病網膜症は、高齢者の視覚障害の主要な原因である。
画像ベースのAIツールは、早期検出の限界を示している。
実験結果を用いたDR予測のための非画像ベース2レベルアンサンブルモデルを提案する。
論文 参考訳(メタデータ) (2025-10-01T16:19:57Z) - A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning [0.0]
我々は,Gumbel copula上尾依存性係数(lambda_U$)を用いて特徴量をランク付けする計算効率の高い教師付きフィルタを提案する。
2つの糖尿病データセット上の4つの分類器で、Mutual Information、mRMR、ReliefF、および$L_1$ Elastic Netを比較した。
上肢依存によるコプラに基づく特徴選択は、公衆衛生・臨床医療におけるリスクモデル構築のための強力で効率的かつ解釈可能なアプローチである。
論文 参考訳(メタデータ) (2025-05-28T16:34:58Z) - A Comparative Study of Diabetes Prediction Based on Lifestyle Factors Using Machine Learning [2.767257448554864]
本研究では,BRFSS(Behavimental Risk Factor Surveillance System)の2015年調査から得られたデータを用いて,生活習慣要因に基づく糖尿病の予測に機械学習モデルを用いることを検討した。
決定木(Decision Tree)、K-Nearest Neighbors(KNN)、ロジスティック回帰(Logistic Regression)の3つの分類モデルを実装し,その予測性能を評価する。
その結果、決定木、KNN、ロジスティック回帰はそれぞれ0.74、0.72、0.75の精度を達成し、精度とリコールの強さは様々であった。
論文 参考訳(メタデータ) (2025-03-06T06:31:40Z) - Towards Transparent and Accurate Diabetes Prediction Using Machine Learning and Explainable Artificial Intelligence [8.224338294959699]
本研究では機械学習モデルとXAIツールを用いた糖尿病予測の枠組みを提案する。
アンサンブルモデルは精度が高く、テスト精度は92.50%、ROC-AUCは0.975であった。
その結果、XAIと組み合わせたMLは、医療システムで使用する正確で計算学的に透過的なツールを開発するための有望な手段であることが示唆された。
論文 参考訳(メタデータ) (2025-01-30T00:42:43Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - On the explainability of hospitalization prediction on a large COVID-19
patient dataset [45.82374977939355]
我々は、新型コロナウイルス陽性の米国の患者の大規模な(110ドル以上)コホートでの入院を予測するために、さまざまなAIモデルを開発した。
高いデータアンバランスにもかかわらず、モデルは平均精度0.96-0.98 (0.75-0.85)、リコール0.96-0.98 (0.74-0.85)、F_score097-0.98 (0.79-0.83)に達する。
論文 参考訳(メタデータ) (2021-10-28T10:23:38Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。