論文の概要: From Prediction to Practice: A Task-Aware Evaluation Framework for Blood Glucose Forecasting
- arxiv url: http://arxiv.org/abs/2605.00645v1
- Date: Fri, 01 May 2026 13:26:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.965561
- Title: From Prediction to Practice: A Task-Aware Evaluation Framework for Blood Glucose Forecasting
- Title(参考訳): 予測から実践へ:血糖予測のためのタスク認識評価フレームワーク
- Authors: Alireza Namazi, Heman Shakeri,
- Abstract要約: 本稿では,低血糖早期警戒とインスリン摂取決定支援という,下流の2つの用途を中心に構築された血糖予測のためのタスクアウェア評価フレームワークを提案する。
早期警戒のために, 患者1日あたりの事象レベルのリコールと誤報を用いて, 3つの臨床コホートからの実データを評価する。
実データ予測に強く見えるモデルは、しばしば、介入効果の方向、大きさ、ランキングを予測できず、臨床的に動機づけられたコストで評価した場合、低用量を選択する。
- 参考スコア(独自算出の注目度): 0.1104960878651584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical time-series forecasting is increasingly studied for decision support, yet standard aggregate metrics can obscure whether a model is actually useful for the task it is meant to serve. In safety-critical settings, low average error can coexist with dangerous failures in exactly the high-risk regimes that matter most. We present a task-aware evaluation framework for blood glucose forecasting built around two downstream uses: hypoglycemia early warning and insulin dosing decision support. For early warning, we evaluate on real data from three clinical cohorts using event-level recall and false alarms per patient-day, metrics that reflect operational alarm burden rather than aggregate accuracy. We show that models appearing acceptable overall, with recall above 0.9 on the full test set, can fail badly in the post-bolus slice, where insulin-on-board is elevated and missed warnings carry the greatest clinical consequences. Standard forecasting evaluation, however, does not test whether a model can reason about the effects of actions, a requirement for supporting insulin dosing decisions. We therefore add a second, interventional arm using the FDA-accepted UVA/Padova simulator, where we evaluate whether forecasters can predict glucose responses to altered insulin plans in paired factual/counterfactual scenarios. We show that models that look strong on real-data forecasting often fail to predict the direction, magnitude, or ranking of intervention effects, and choose poor insulin doses when evaluated under a clinically motivated cost. Taken together, the two arms reveal a consistent gap between forecasting accuracy and task-relevant usefulness. We release the benchmark, the standardized preprocessing pipeline for public cohorts, and the simulator-based interventional dataset as a reproducible toolkit.
- Abstract(参考訳): 臨床時系列予測は意思決定支援のためにますます研究されているが、標準集約メトリクスは、そのモデルが実際に役立ちそうなタスクに実際に役立つかどうかを曖昧にすることができる。
安全クリティカルな設定では、低い平均誤差は、最も重要なリスクの高い状況において、危険な失敗と共存することができる。
本稿では,低血糖早期警戒とインスリン摂取決定支援という,下流の2つの用途を中心に構築された血糖予測のためのタスクアウェア評価フレームワークを提案する。
早期警戒のために, 患者1日あたりの事象レベルのリコールと誤報を用いて, 3つの臨床コホートからの実データを評価する。
完全テストセットの0.9以上をリコールしたモデルでは,インスリンオンボードが上昇し,警告の欠落が臨床効果の最大の要因となるが,術後スライスでは失敗する可能性が示唆された。
しかし、標準予測評価では、モデルがインスリン摂取決定を支援するための要件である行動の効果を推論できるかどうかを検証していない。
そこで,FDA が承認した UVA/Padova シミュレータを用いた2つ目の介入アームを追加する。
実データ予測に強く見えるモデルは、しばしば、介入効果の方向、大きさ、ランキングを予測できず、臨床的に動機づけられたコストで評価した場合、低用量を選択する。
両腕を合わせると、予測精度とタスク関連の有用性の間に一貫したギャップが明らかになる。
このベンチマーク、公開コホートのための標準化された前処理パイプライン、再現可能なツールキットとしてのシミュレータベースの介入データセットをリリースする。
関連論文リスト
- Uncertainty-aware Blood Glucose Prediction from Continuous Glucose Monitoring Data [0.0]
本研究では,1型糖尿病における血糖予測と血糖異常事象同定のための不確実性を考慮したニューラルネットワークモデルについて検討した。
出力ヘッドを備えたTransformerベースのモデルが最も有効な不確実性認識フレームワークであることが判明した。
論文 参考訳(メタデータ) (2026-03-05T08:49:43Z) - Towards Trustworthy Vital Sign Forecasting: Leveraging Uncertainty for Prediction Intervals [32.233133404873016]
本稿では,不確実性評価(Restruction Uncertainty Estimate, RUE)からPIを導出する2つの手法を提案する。
これらの手法を、高頻度および低頻度の健康信号を表わし、分・時間レベルのサンプリングを施した2つの大規模公共データセット上で評価した。
論文 参考訳(メタデータ) (2025-09-01T10:03:26Z) - SepsisLab: Early Sepsis Prediction with Uncertainty Quantification and Active Sensing [67.8991481023825]
セプシスは米国での院内死亡の主な原因である。
既存の予測モデルは通常、情報不足の少ない高品質なデータで訓練される。
限られた観察により信頼性の低い高リスク患者に対して,ロバストな能動センシングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:47:36Z) - CenTime: Event-Conditional Modelling of Censoring in Survival Analysis [49.44664144472712]
CenTimeは、イベントへの時間を直接見積もる、サバイバル分析の新しいアプローチである。
本手法は,非検閲データが少ない場合でも,堅牢なイベント条件検閲機構を特徴とする。
以上の結果から,CenTimeは同等の性能を維持しつつ,死までの時間を予測する上で,最先端のパフォーマンスを提供することがわかった。
論文 参考訳(メタデータ) (2023-09-07T17:07:33Z) - EventScore: An Automated Real-time Early Warning Score for Clinical
Events [3.3039612529376625]
臨床劣化を示す各種臨床事象の早期予測のための解釈可能なモデルを構築した。
このモデルは2つのデータセットと4つの臨床イベントで評価される。
私達のモデルは手動で記録された特徴を要求しないで完全に自動化することができます。
論文 参考訳(メタデータ) (2021-02-11T11:55:08Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Prediction-Coherent LSTM-based Recurrent Neural Network for Safer
Glucose Predictions in Diabetic People [4.692400531340393]
本稿では,予測の安定性を高めるLSTMに基づくリカレントニューラルネットワークアーキテクチャと損失関数を提案する。
研究は1型と2型糖尿病患者を対象に行われ、30分前の予測に焦点をあてた。
論文 参考訳(メタデータ) (2020-09-08T13:14:08Z) - Short Term Blood Glucose Prediction based on Continuous Glucose
Monitoring Data [53.01543207478818]
本研究では,デジタル意思決定支援ツールの入力として連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データを利用する方法について検討する。
短時間の血液グルコース (STBG) 予測において, リカレントニューラルネットワーク (Recurrent Neural Networks, RNN) をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2020-02-06T16:39:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。