論文の概要: Generalizable Diabetes Risk Stratification via Hybrid Machine Learning Models
- arxiv url: http://arxiv.org/abs/2509.20565v1
- Date: Wed, 24 Sep 2025 21:18:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.59023
- Title: Generalizable Diabetes Risk Stratification via Hybrid Machine Learning Models
- Title(参考訳): ハイブリッド機械学習モデルによる糖尿病リスク階層化
- Authors: Athar Parvez, Muhammad Jawad Mufti,
- Abstract要約: 糖尿病は世界中で5億3700万人を超え、2045年までに7億8300万人に達すると予測されている。
2つのハイブリッド分類器を比較し、外部コホート上での一般化性を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background/Purpose: Diabetes affects over 537 million people worldwide and is projected to reach 783 million by 2045. Early risk stratification can benefit from machine learning. We compare two hybrid classifiers and assess their generalizability on an external cohort. Methods: Two hybrids were built: (i) XGBoost + Random Forest (XGB-RF) and (ii) Support Vector Machine + Logistic Regression (SVM-LR). A leakage-safe, standardized pipeline (encoding, imputation, min-max scaling; SMOTE on training folds only; probability calibration for SVM) was fit on the primary dataset and frozen. Evaluation prioritized threshold-independent discrimination (AUROC/AUPRC) and calibration (Brier, slope/intercept). External validation used the PIMA cohort (N=768) with the frozen pipeline; any thresholded metrics on PIMA were computed at the default rule tau = 0.5. Results: On the primary dataset (PR baseline = 0.50), XGB-RF achieved AUROC ~0.995 and AUPRC ~0.998, outperforming SVM-LR (AUROC ~0.978; AUPRC ~0.947). On PIMA (PR baseline ~0.349), XGB-RF retained strong performance (AUROC ~0.990; AUPRC ~0.959); SVM-LR was lower (AUROC ~0.963; AUPRC ~0.875). Thresholded metrics on PIMA at tau = 0.5 were XGB-RF (Accuracy 0.960; Precision 0.941; Recall 0.944; F1 0.942) and SVM-LR (Accuracy 0.900; Precision 0.855; Recall 0.858; F1 0.857). Conclusions: Across internal and external cohorts, XGB-RF consistently dominated SVM-LR and exhibited smaller external attenuation on ROC/PR with acceptable calibration. These results support gradient-boosting-based hybridization as a robust, transferable approach for diabetes risk stratification and motivate prospective, multi-site validation with deployment-time threshold selection based on clinical trade-offs.
- Abstract(参考訳): 背景/目的: 糖尿病は世界中で5億3700万人を超え、2045年までに7億8300万人に達すると予測されている。
早期のリスク階層化は、機械学習の恩恵を受けることができる。
2つのハイブリッド分類器を比較し、外部コホート上での一般化性を評価する。
方法:2つのハイブリッドが製造された。
(i)XGBoost+ランダムフォレスト(XGB-RF)
(ii) ベクトルマシン+ロジスティック回帰(SVM-LR)のサポート。
リークセーフで標準化されたパイプライン(エンコード、インプット、min-maxスケーリング、トレーニング用のSMOTEのみ、SVMの確率キャリブレーション)は、プライマリデータセットに適合し、凍結された。
AUROC/AUPRCとキャリブレーション(Brier, slope/intercept)の評価を行った。
外部検証では、PIMAコホート(N=768)と凍結パイプラインを使用しており、PIMA上のしきい値はすべて、デフォルトの規則 tau = 0.5 で計算された。
結果: 一次データセット (PRbaseline = 0.50) では, XGB-RF が AUROC ~0.995 と AUPRC ~0.998 となり, SVM-LR (AUROC ~0.978; AUPRC ~0.947) を上回った。
PIMA(PRベースライン~0.349)では、XGB-RFは強い性能(AUROC ~0.990; AUPRC ~0.959)を維持し、SVM-LRは低い(AUROC ~0.963; AUPRC ~0.875)。
Tau = 0.5におけるPIMAの閾値は、XGB-RF(精度0.960;精度0.941;リコール0.944;F1 0.942)とSVM-LR(精度0.900;精度0.855;リコール0.858;F1 0.857)である。
結論: 内外コホート全体において, XGB-RFはSVM-LRを一貫して支配し, キャリブレーションが許容されるROC/PRの外部減衰は小さくなった。
これらの結果は、糖尿病リスク層化のための頑健かつ伝達可能なアプローチとして、グラデーション・ブースティングに基づくハイブリッド化をサポートし、臨床トレードオフに基づくデプロイメント時間しきい値選択による先進的マルチサイトバリデーションを動機づける。
関連論文リスト
- Enhancement Without Contrast: Stability-Aware Multicenter Machine Learning for Glioma MRI Imaging [2.5012408467295555]
機械学習(ML)を用いた非コントラストMRIからのコントラスト強調予測は、ガドリニウムベースのコントラストエージェント(GBCA)のより安全な代替手段を提供する
グリオーマMRIコントラスト強調のマルチセンター予測のための再現可能なMLパイプラインを同定するための安定性を考慮したフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-13T00:47:07Z) - Machine Generalize Learning in Agent-Based Models: Going Beyond Surrogate Models for Calibration in ABMs [0.0]
キャリブレーションエージェントベースの疫病モデルは、計算的に要求されている。
本稿では,流行時系列からSIRパラメータへの逆写像を学習する教師付き機械学習校正器を提案する。
論文 参考訳(メタデータ) (2025-09-06T18:28:00Z) - Differentiated Thyroid Cancer Recurrence Classification Using Machine Learning Models and Bayesian Neural Networks with Varying Priors: A SHAP-Based Interpretation of the Best Performing Model [0.0]
甲状腺癌のDTC再発は主要な公衆衛生上の問題である。
本研究は, 383名の患者を対象としたデータセットを用いて, DTC再分類のための包括的枠組みを提案する。
論文 参考訳(メタデータ) (2025-07-25T06:31:31Z) - Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.1574468325115]
本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。
評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文 参考訳(メタデータ) (2025-05-23T14:06:42Z) - CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - Comparing Hyper-optimized Machine Learning Models for Predicting Efficiency Degradation in Organic Solar Cells [38.647921189039934]
本研究は,有機太陽電池 (OSC) の電力変換効率 (PCE) に苦しむ時間的劣化を表現するための機械学習モデルを提案する。
製造プロセスと環境条件の両方に関して最大7変数を含む996項目のデータベースを180日間以上作成しました。
一方、根平均二乗誤差(RMSE)、二乗誤差(SSE)の和、および平均絶対誤差(MAE)>1%の目標値であるPCEは、係数決定(R2)の値に達した。
論文 参考訳(メタデータ) (2024-03-29T22:05:26Z) - Attention-based Saliency Maps Improve Interpretability of Pneumothorax
Classification [52.77024349608834]
視覚変換器(ViT)の胸部X線撮影(CXR)分類性能と注意ベース唾液の解釈可能性について検討する。
ViTは、CheXpert、Chest X-Ray 14、MIMIC CXR、VinBigDataの4つの公開データセットを用いて、肺疾患分類のために微調整された。
ViTsは最先端のCNNと比べてCXR分類AUCに匹敵するものであった。
論文 参考訳(メタデータ) (2023-03-03T12:05:41Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - DeepCOVID-Fuse: A Multi-modality Deep Learning Model Fusing Chest
X-Radiographs and Clinical Variables to Predict COVID-19 Risk Levels [8.593516170110203]
DeepCOVID-Fuseは、新型コロナウイルス患者のリスクレベルを予測するディープラーニング融合モデルである。
CXRと臨床変数で訓練されたDeepCOVID-Fuseの精度は0.658であり、AUCは0.842である。
論文 参考訳(メタデータ) (2023-01-20T20:54:25Z) - Limitations of ROC on Imbalanced Data: Evaluation of LVAD Mortality Risk
Scores [2.578242050187029]
受信動作特性 (ROC) は分類器の性能の一般的な指標である。
ROCは、生き残る患者の圧倒的に多いため、短期的な死亡を予測できる分類器の歪んだビューを提供することができる。
本研究は,90日間のLVAD死亡に対する2つの分類器の成績について,ROCとPRCを比較した。
論文 参考訳(メタデータ) (2020-10-29T11:10:15Z) - Automated Quantification of CT Patterns Associated with COVID-19 from
Chest CT [48.785596536318884]
提案法は,非造影胸部CTを入力として,病変,肺,葉を3次元に分割する。
この方法では、肺の重症度と葉の関与度を2つの組み合わせて測定し、COVID-19の異常度と高不透明度の存在度を定量化する。
このアルゴリズムの評価は、カナダ、ヨーロッパ、米国からの200人の参加者(感染者100人、健康管理100人)のCTで報告されている。
論文 参考訳(メタデータ) (2020-04-02T21:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。