論文の概要: GUIDE: Reinforcement Learning for Behavioral Action Support in Type 1 Diabetes
- arxiv url: http://arxiv.org/abs/2604.00385v1
- Date: Wed, 01 Apr 2026 02:14:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.793249
- Title: GUIDE: Reinforcement Learning for Behavioral Action Support in Type 1 Diabetes
- Title(参考訳): GUIDE:1型糖尿病の行動行動支援のための強化学習
- Authors: Saman Khamesian, Sri Harini Balaji, Di Yang Shi, Stephanie M. Carpenter, Daniel E. Rivera, W. Bradley Knox, Peter Stone, Hassan Ghasemzadeh,
- Abstract要約: GUIDE(GUIDE)は、AID技術を補完するRLベースの意思決定支援フレームワークである。
介入タイプ、マグニチュード、タイミングで定義された構造化されたアクションを生成する。
現実の連続グルコースモニタリングデータに基づいて訓練された患者固有のグルコースレベル予測器を統合する。
- 参考スコア(独自算出の注目度): 15.973355999714558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Type 1 Diabetes (T1D) management requires continuous adjustment of insulin and lifestyle behaviors to maintain blood glucose within a safe target range. Although automated insulin delivery (AID) systems have improved glycemic outcomes, many patients still fail to achieve recommended clinical targets, warranting new approaches to improve glucose control in patients with T1D. While reinforcement learning (RL) has been utilized as a promising approach, current RL-based methods focus primarily on insulin-only treatment and do not provide behavioral recommendations for glucose control. To address this gap, we propose GUIDE, an RL-based decision-support framework designed to complement AID technologies by providing behavioral recommendations to prevent abnormal glucose events. GUIDE generates structured actions defined by intervention type, magnitude, and timing, including bolus insulin administration and carbohydrate intake events. GUIDE integrates a patient-specific glucose level predictor trained on real-world continuous glucose monitoring data and supports both offline and online RL algorithms within a unified environment. We evaluate both off-policy and on-policy methods across 25 individuals with T1D using standardized glycemic metrics. Among the evaluated approaches, the CQL-BC algorithm demonstrates the highest average time-in-range, reaching 85.49% while maintaining low hypoglycemia exposures. Behavioral similarity analysis further indicates that the learned CQL-BC policy preserves key structural characteristics of patient action patterns, achieving a mean cosine similarity of 0.87 $\pm$ 0.09 across subjects. These findings suggest that conservative offline RL with a structured behavioral action space can provide clinically meaningful and behaviorally plausible decision support for personalized diabetes management.
- Abstract(参考訳): 1型糖尿病(T1D)の管理には、安全な標的範囲内で血糖値を維持するためにインスリンとライフスタイルの継続的な調整が必要である。
自動インスリンデリバリー(AID)システムは血糖値を改善しているが、多くの患者は推奨された臨床目標を達成することができず、T1D患者の血糖コントロールを改善するための新しいアプローチを保証している。
強化学習(RL)は有望なアプローチとして活用されているが、現在のRLベースの手法は主にインスリンのみの治療法に焦点をあてており、グルコース制御のための行動勧告を提供していない。
このギャップに対処するため,我々は,異常なグルコース発生を防止するための行動レコメンデーションを提供することで,AID技術を補完するRLベースの意思決定支援フレームワークであるGUIDEを提案する。
GUIDEは、インスリン投与や炭水化物摂取イベントを含む介入タイプ、大きさ、タイミングによって定義される構造化されたアクションを生成する。
GUIDEは、現実の連続グルコースモニタリングデータに基づいて訓練された患者固有のグルコースレベル予測器を統合し、統合された環境でオフラインおよびオンラインRLアルゴリズムの両方をサポートする。
標準グリセミック指標を用いて,T1D患者25名を対象に,非政治的・非政治的手法の評価を行った。
評価されたアプローチの中で、CQL-BCアルゴリズムは平均時差が最も高く、低血糖曝露を維持しながら85.49%に達した。
行動類似性分析は、学習したCQL-BCポリシーが患者行動パターンの重要な構造的特徴を保ち、被験者の平均コサイン類似度は0.87$\pm$ 0.09であることを示している。
これらの結果から, 構造的行動行動空間を有する保存的オフラインRLは, 糖尿病管理に臨床的に有意で, 行動学的に妥当な決定支援を提供する可能性が示唆された。
関連論文リスト
- Integrating Neural Differential Forecasting with Safe Reinforcement Learning for Blood Glucose Regulation [51.12307713554633]
TSODEは、Thompson RL SmplingとNeural Ordinary Differential Equation forecasterを統合した安全対応のコントローラである。
FDAが承認したUVa/Padovaシミュレータ(adult cohort)では、TSODEは87.9%のタイムインレンジを達成した。
論文 参考訳(メタデータ) (2025-11-16T02:11:33Z) - Insulin Resistance Prediction From Wearables and Routine Blood Biomarkers [44.735350554750916]
われわれはインスリン抵抗性の研究のために、米国全土でこれまでで最大のデータセットをリモートで採用しました。
ディープニューラルネットワークモデルは、簡単に利用可能なデジタルバイオマーカーと血液バイオマーカーに基づいてインスリン抵抗を予測するために開発された。
モデルでは、肥満および妊娠中の被験者の93%の感度と95%の調整された特異性を示した。
論文 参考訳(メタデータ) (2025-04-30T16:10:20Z) - GlyTwin: Digital Twin for Glucose Control in Type 1 Diabetes Through Optimal Behavioral Modifications Using Patient-Centric Counterfactuals [6.102406188211489]
GlyTwinは、グルコース調節のための最適処理をシミュレートするために、対実的説明を用いた新しいデジタルツインフレームワークである。
GlyTwinは高血糖を予防する行動療法の提案を生成する。
結果は、GlyTwinが最先端のカウンターファクト法を上回り、76.6%が有効で、86%が効果的な介入を生んでいることを示している。
論文 参考訳(メタデータ) (2025-04-14T03:32:39Z) - Precise Insulin Delivery for Artificial Pancreas: A Reinforcement Learning Optimized Adaptive Fuzzy Control Approach [0.0]
本稿では,1型高木-菅野ファジィ制御器のパラメータを最適化するための強化学習の適用について検討する。
本研究は, 食事サイズやタイミングの変動に対して, 制御器の頑健性を大幅に向上させることを実証した。
論文 参考訳(メタデータ) (2025-03-09T17:34:09Z) - From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [47.23780364438969]
本稿では,CGMデータの生成基盤モデルであるGluFormerについて紹介する。
GluFormerは、異なる民族や年齢、5つの国、8つのCGMデバイス、多様な病態状態にまたがる19の外部コホートに一般化する。
CGMデータと12年間のフォローアップを持つ580人の成人の縦断的研究において、GluFormerは血液HbA1C%よりも糖尿病を効果的に発症するリスクが高い個人を特定する。
論文 参考訳(メタデータ) (2024-08-20T13:19:06Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Offline Reinforcement Learning for Safer Blood Glucose Control in People
with Type 1 Diabetes [1.1859913430860336]
オンライン強化学習(RL)は、糖尿病デバイスにおける血糖コントロールをさらに強化する方法として利用されてきた。
本稿では,FDAが承認したUVA/パドバ血糖動態シミュレータで利用可能な30名の仮想的患者の血糖管理におけるBCQ,CQL,TD3-BCの有用性について検討する。
オフラインのRLは、61.6 +-0.3%から65.3 +/-0.5%までの健康な血糖値において、最強の最先端のベースラインに比べて有意に上昇する。
論文 参考訳(メタデータ) (2022-04-07T11:52:12Z) - Short Term Blood Glucose Prediction based on Continuous Glucose
Monitoring Data [53.01543207478818]
本研究では,デジタル意思決定支援ツールの入力として連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データを利用する方法について検討する。
短時間の血液グルコース (STBG) 予測において, リカレントニューラルネットワーク (Recurrent Neural Networks, RNN) をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2020-02-06T16:39:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。