論文の概要: Calibration, Uncertainty Communication, and Deployment Readiness in CKD Risk Prediction: A Framework Evaluation Study
- arxiv url: http://arxiv.org/abs/2605.21566v1
- Date: Wed, 20 May 2026 17:12:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:41.943625
- Title: Calibration, Uncertainty Communication, and Deployment Readiness in CKD Risk Prediction: A Framework Evaluation Study
- Title(参考訳): CKDリスク予測における校正・不確実性コミュニケーション・展開準備性:フレームワーク評価研究
- Authors: Michael O. Eniolade,
- Abstract要約: 慢性腎臓病の機械学習モデルは、しばしば内部テストセットに強い差別的スコアを与える。
UCI CKDデータセット(400例,62.5%)を用いた5つの分類器の訓練を行った。
キャリブレーション品質,コンフォーマルな予測カバレッジ,8基準の展開準備フレームワークについて検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning models for chronic kidney disease (CKD) risk prediction often post strong discrimination scores on internal test sets. Calibration and uncertainty quantification get far less attention, leaving clinicians without reliable information about whether the probability outputs are accurate. We trained five classifiers on the UCI CKD dataset (400 patients, 62.5% CKD prevalence): logistic regression, random forest, XGBoost, SVM with Platt scaling, and Gaussian naive Bayes. We evaluated each across calibration quality, conformal prediction coverage, and an eight-criterion deployment readiness framework. A distributional stress-test applied the best-calibrated variant of each model to the open-access MIMIC-IV demo cohort (97 patients, 23.7% CKD) to assess behaviour under prevalence shift and feature missingness. We measured calibration before and after Platt scaling and isotonic regression using Expected Calibration Error and Brier Score, and quantified uncertainty through split conformal prediction targeting 90% marginal coverage. All five models reached AUROC 1.00 on the UCI test set. Isotonic recalibration reduced internal ECE to 0.000-0.022. On MIMIC-IV, AUROC fell to 0.48-0.58, ECE rose to 0.68-0.76, and conformal coverage dropped from 0.80-0.98 to 0.21-0.25 against a 90% target. No model scored above 4 out of 16 on the deployment readiness checklist. Near-perfect internal performance did not transfer. Calibration stability and conformal coverage should be evaluated on external data before any clinical prediction model moves toward deployment.
- Abstract(参考訳): 慢性腎臓病(CKD)のリスク予測のための機械学習モデルは、しばしば内部テストセットに対して強力な差別スコアを投稿する。
校正と不確実な定量化ははるかに注意を引いており、臨床医は確率出力が正確かどうかの信頼性のない情報を残している。
UCI CKDデータセット(400例,62.5%)を用いて,ロジスティック回帰,ランダムフォレスト,XGBoost,SVM,Plattスケーリング,Gaussian naive Bayesの5つの分類器を訓練した。
キャリブレーション品質,コンフォーマルな予測カバレッジ,8基準の展開準備フレームワークについて検討した。
分布性ストレステストでは、各モデルの最良の校正版をオープンアクセスMIMIC-IVデモコホート(97例、23.7% CKD)に適用し、頻度シフトと特徴欠如の行動を評価する。
我々は,Plattスケーリング前後のキャリブレーションとアイソトニックレグレッションを期待キャリブレーション誤差とBrier Scoreを用いて測定し,90%の限界カバレッジを目標とした分割共形予測による不確かさの定量化を行った。
5機種ともUCIテストセットでAUROC 1.00に到達した。
イソトニック再校正により内部ECEは0.000-0.022に減少した。
MIMIC-IVでは、AUROCは0.48-0.58に低下し、ECEは0.68-0.76に上昇し、コンフォメーションカバーは90%の目標に対して0.80-0.98から0.21-0.25に低下した。
デプロイメントの準備ができているチェックリストでは、16点中4点以上のモデルはない。
ほぼ完全な内部性能は移行しなかった。
臨床予測モデルが展開に向けて進む前に, キャリブレーション安定性とコンフォメーションカバレッジを外部データで評価する必要がある。
関連論文リスト
- Predictive Entropy Links Calibration and Paraphrase Sensitivity in Medical Vision-Language Models [2.064612766965483]
我々は,MedGemma 4BITの分布MIMIC CXRと外分布PadChest chest X ray データセットの5つの不確実性定量化手法を示し,LLaVA RAD7Bのクロスアーキテクチャ検証を行った。
うまく校正された単一モデル法では、一方のフォワードパスからの予測エントロピーは、メドジェマのAUROC 0.711、LLaVARAD p 10 4の0.878、信頼できないと敏感な予測の両方を1つのエントロピーしきい値でフラグ付けることができる。
論文 参考訳(メタデータ) (2026-04-10T04:18:47Z) - Tipping the Balance: Impact of Class Imbalance Correction on the Performance of Clinical Risk Prediction Models [2.2534253247996214]
クラス不均衡補正技術は、稀な結果を伴う設定におけるモデル性能を改善するために一般的に用いられる。
本研究は,リアルタイム臨床予測タスクの判別と校正に広く用いられているリサンプリング戦略が及ぼす影響について検討した。
論文 参考訳(メタデータ) (2026-02-27T12:29:16Z) - EMBC Special Issue: Calibrated Uncertainty for Trustworthy Clinical Gait Analysis Using Probabilistic Multiview Markerless Motion Capture [1.260797434681533]
ビデオに基づく人間の運動分析は、臨床および研究における運動評価の可能性を秘めている。
本研究では,確率論的多視点マーカーレスモーションキャプチャ法の校正と信頼性を評価する。
確率モデル再構成は不確実性を定量化し、同時に接地構造を計測することなく信頼できない出力を特定できる。
論文 参考訳(メタデータ) (2026-01-29T23:50:19Z) - Explainable Admission-Level Predictive Modeling for Prolonged Hospital Stay in Elderly Populations: Challenges in Low- and Middle-Income Countries [65.4286079244589]
長期滞在期間 (pLoS) は, 院内感染のリスクに関連する重要な要因である。
入院レベルの患者と病院の診療データを用いて, pLosの予測モデルを開発し, 解説する。
論文 参考訳(メタデータ) (2026-01-07T23:35:24Z) - Causal Judge Evaluation: Calibrated Surrogate Metrics for LLM Systems [0.29465623430708904]
未校正スコアは選好を逆転させることができ、未校正スコアに対するナイーブな信頼区間は、ほぼ0%のカバレッジを獲得し、重要度重み付け推定器は、限られた重複の下で崩壊する。
3つの障害を全て解決するフレームワークであるCausal Judge Evaluationを紹介します。
論文 参考訳(メタデータ) (2025-12-11T22:16:24Z) - An Explainable and Fair AI Tool for PCOS Risk Assessment: Calibration, Subgroup Equity, and Interactive Clinical Deployment [0.10026496861838446]
本稿では,多嚢胞性卵巣症候群(PCOS)の予測のための,公平で解釈可能な機械学習フレームワークを提案する。
このフレームワークは、SHAPに基づく特徴属性と人口統計監査を統合し、予測的説明と観察的差異を関連付ける。
StreamlitベースのWebインターフェースは、リアルタイムPCOSリスク評価、ロッテルダム基準評価、インタラクティブな「What-if」分析を可能にする。
論文 参考訳(メタデータ) (2025-11-08T16:14:56Z) - Conformal Lesion Segmentation for 3D Medical Images [82.92159832699583]
本稿では,データ駆動しきい値の校正をコンフォーマル化することで,テスト時間FNRが目標許容値以下であることを保証する,リスク制約付きフレームワークを提案する。
5つのバックボーンモデルにまたがる6つの3D-LSデータセット上でのCLSの統計的健全性と予測性能を検証し,臨床実践におけるリスク認識セグメンテーションの展開に関する実用的な知見を得た。
論文 参考訳(メタデータ) (2025-10-19T08:21:00Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。