論文の概要: Offline Reinforcement Learning for Safer Blood Glucose Control in People
with Type 1 Diabetes
- arxiv url: http://arxiv.org/abs/2204.03376v2
- Date: Fri, 5 May 2023 10:04:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 17:50:35.233504
- Title: Offline Reinforcement Learning for Safer Blood Glucose Control in People
with Type 1 Diabetes
- Title(参考訳): 1型糖尿病患者における血糖コントロールのためのオフライン強化学習
- Authors: Harry Emerson, Matthew Guy and Ryan McConville
- Abstract要約: オンライン強化学習(RL)は、糖尿病デバイスにおける血糖コントロールをさらに強化する方法として利用されてきた。
本稿では,FDAが承認したUVA/パドバ血糖動態シミュレータで利用可能な30名の仮想的患者の血糖管理におけるBCQ,CQL,TD3-BCの有用性について検討する。
オフラインのRLは、61.6 +-0.3%から65.3 +/-0.5%までの健康な血糖値において、最強の最先端のベースラインに比べて有意に上昇する。
- 参考スコア(独自算出の注目度): 1.1859913430860336
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The widespread adoption of effective hybrid closed loop systems would
represent an important milestone of care for people living with type 1 diabetes
(T1D). These devices typically utilise simple control algorithms to select the
optimal insulin dose for maintaining blood glucose levels within a healthy
range. Online reinforcement learning (RL) has been utilised as a method for
further enhancing glucose control in these devices. Previous approaches have
been shown to reduce patient risk and improve time spent in the target range
when compared to classical control algorithms, but are prone to instability in
the learning process, often resulting in the selection of unsafe actions. This
work presents an evaluation of offline RL for developing effective dosing
policies without the need for potentially dangerous patient interaction during
training. This paper examines the utility of BCQ, CQL and TD3-BC in managing
the blood glucose of the 30 virtual patients available within the FDA-approved
UVA/Padova glucose dynamics simulator. When trained on less than a tenth of the
total training samples required by online RL to achieve stable performance,
this work shows that offline RL can significantly increase time in the healthy
blood glucose range from 61.6 +\- 0.3% to 65.3 +/- 0.5% when compared to the
strongest state-of-art baseline (p < 0.001). This is achieved without any
associated increase in low blood glucose events. Offline RL is also shown to be
able to correct for common and challenging control scenarios such as incorrect
bolus dosing, irregular meal timings and compression errors.
- Abstract(参考訳): 効果的なハイブリッドクローズドループシステムの普及は、1型糖尿病(T1D)患者のケアの重要なマイルストーンとなる。
これらの装置は通常、単純な制御アルゴリズムを使用して、健康な範囲で血糖値を維持するのに最適なインスリン量を選択する。
オンライン強化学習(RL)は、これらのデバイスにおけるグルコース制御をさらに強化する方法として利用されてきた。
従来のアプローチは、古典的な制御アルゴリズムと比較して患者リスクを減らし、目標範囲に費やした時間を改善することが示されているが、学習過程において不安定になりがちであり、多くの場合、安全でない行動を選択する。
本研究は、トレーニング中の潜在的に危険な患者との相互作用を必要とせず、効果的な服用ポリシーを開発するためのオフラインRLの評価である。
本稿では,FDAが承認したUVA/パドバ血糖動態シミュレータで利用可能な30名の仮想的患者の血糖管理におけるBCQ,CQL,TD3-BCの有用性について検討する。
オンラインRLが安定した性能を達成するのに必要なトレーニングサンプルの10分の1以下でトレーニングすると、オフラインRLは、最強の最先端のベースライン(p < 0.001)と比較して、61.6 +\- 0.3%から65.3 +/- 0.5%までの健康な血糖値の時間を大幅に増加させることができる。
これは血糖値の低下を伴わずに達成される。
オフラインRLはまた、不正な食事時間、不規則な食事時間、圧縮エラーなど、一般的な、困難な制御シナリオを修正可能である。
関連論文リスト
- From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [50.80532910808962]
GluFormerは、トランスフォーマーアーキテクチャに基づく生体医学的時間的データの生成基盤モデルである。
GluFormerは5つの地理的領域にまたがる4936人を含む15の異なる外部データセットに一般化されている。
今後4年間の健康状態も予測できる。
論文 参考訳(メタデータ) (2024-08-20T13:19:06Z) - DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning [61.10299147201369]
本稿では,Wild デバイス制御エージェントをトレーニングするための新しい自律型 RL 手法である DigiRL を提案する。
VLMベースの評価器を備えた,スケーラブルで並列化可能なAndroid学習環境を構築する。
我々はAndroid-in-the-Wildデータセットを使用してDigiRLの有効性を実証し、RLでトレーニングした1.3B VLMは49.5%の絶対改善を実現した。
論文 参考訳(メタデータ) (2024-06-14T17:49:55Z) - Using Reinforcement Learning to Simplify Mealtime Insulin Dosing for
People with Type 1 Diabetes: In-Silico Experiments [0.40792653193642503]
1型糖尿病(T1D)の患者は、食事時に最適なインスリン摂取量を計算するのに苦労する。
定性食事(QM)戦略に対応する最適な食事関連インスリン投与を推奨するRLエージェントを提案する。
論文 参考訳(メタデータ) (2023-09-17T01:34:02Z) - Self-Supervised Pretraining Improves Performance and Inference
Efficiency in Multiple Lung Ultrasound Interpretation Tasks [65.23740556896654]
肺超音波検査における複数分類課題に適用可能なニューラルネットワーク特徴抽出器を,自己指導型プレトレーニングで作成できるかどうかを検討した。
3つの肺超音波のタスクを微調整すると、事前訓練されたモデルにより、各テストセットの受信操作曲線(AUC)における平均クロスタスク面積は、それぞれ0.032と0.061に改善された。
論文 参考訳(メタデータ) (2023-09-05T21:36:42Z) - Basal-Bolus Advisor for Type 1 Diabetes (T1D) Patients Using Multi-Agent
Reinforcement Learning (RL) Methodology [0.0]
本稿では,1型糖尿病(T1D)患者におけるパーソナライズされたグルコース制御のための新しいマルチエージェント強化学習(RL)手法を提案する。
本発明の方法は、血液グルコース(BG)代謝モデルと、ベーサル・ボールス・アドバイザとして作用するマルチエージェントソフトアクター・クリティックRLモデルとからなるクローズドループシステムを用いる。
以上の結果から,RLをベースとしたベーサル・ボルス・アドバイザは血糖コントロールを著しく改善し,血糖変動を低減し,目標範囲内での時間を短縮することが示された。
論文 参考訳(メタデータ) (2023-07-17T23:50:51Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Building Brains: Subvolume Recombination for Data Augmentation in Large
Vessel Occlusion Detection [56.67577446132946]
この戦略をデータから学ぶためには、標準的なディープラーニングベースのモデルに対して、大規模なトレーニングデータセットが必要である。
そこで本研究では, 異なる患者から血管木セグメントを組換えることで, 人工的なトレーニングサンプルを生成する方法を提案する。
拡張スキームに則って,タスク固有の入力を入力した3D-DenseNetを用いて,半球間の比較を行う。
論文 参考訳(メタデータ) (2022-05-05T10:31:57Z) - LSTMs and Deep Residual Networks for Carbohydrate and Bolus
Recommendations in Type 1 Diabetes Management [4.01573226844961]
本研究では, LSTMを用いた血糖値予測手法について紹介する。
次に、同じ推奨タスクのための新しいアーキテクチャを導き出します。
OhioT1DMデータセットの実際の患者データを用いた実験的評価は、新しい統合アーキテクチャが以前のLSTMベースのアプローチと良好に比較できることを示している。
論文 参考訳(メタデータ) (2021-03-06T19:06:14Z) - Deep Reinforcement Learning for Closed-Loop Blood Glucose Control [12.989855325491163]
自動血糖コントロールのための強化学習技術を開発した。
30人のシミュレーション患者から得られた2100万時間以上のデータに基づいて、我々のRLアプローチはベースライン制御アルゴリズムより優れています。
論文 参考訳(メタデータ) (2020-09-18T20:15:02Z) - Basal Glucose Control in Type 1 Diabetes using Deep Reinforcement
Learning: An In Silico Validation [16.93692520921499]
単一ホルモン(インスリン)と二重ホルモン(インスリンとグルカゴン)のデリバリーのための新しい深層強化学習モデルを提案する。
成体コホートでは、目標範囲のパーセンテージは77.6%から80.9%に改善した。
青年コホートでは、目標範囲のパーセンテージが55.5%から65.9%に改善され、単一ホルモンが制御された。
論文 参考訳(メタデータ) (2020-05-18T20:13:16Z) - Short Term Blood Glucose Prediction based on Continuous Glucose
Monitoring Data [53.01543207478818]
本研究では,デジタル意思決定支援ツールの入力として連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データを利用する方法について検討する。
短時間の血液グルコース (STBG) 予測において, リカレントニューラルネットワーク (Recurrent Neural Networks, RNN) をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2020-02-06T16:39:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。