論文の概要: Offline Reinforcement Learning for Safer Blood Glucose Control in People
with Type 1 Diabetes
- arxiv url: http://arxiv.org/abs/2204.03376v1
- Date: Thu, 7 Apr 2022 11:52:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-08 23:01:34.748244
- Title: Offline Reinforcement Learning for Safer Blood Glucose Control in People
with Type 1 Diabetes
- Title(参考訳): 1型糖尿病患者における血糖コントロールのためのオフライン強化学習
- Authors: Harry Emerson, Matt Guy and Ryan McConville
- Abstract要約: ハイブリッドクローズドループシステムは1型糖尿病(T1D)患者のケアの未来を表わす
オンライン強化学習は、これらのデバイスにおけるグルコース制御をさらに強化する方法として利用されてきた。
本稿では, UVA/Padova 血糖動態シミュレータにおいて, 血液グルコース管理におけるBCQ, CQL, TD3-BCの有用性について検討した。
- 参考スコア(独自算出の注目度): 1.1859913430860336
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hybrid closed loop systems represent the future of care for people with type
1 diabetes (T1D). These devices usually utilise simple control algorithms to
select the optimal insulin dose for maintaining blood glucose levels within a
healthy range. Online reinforcement learning (RL) has been utilised as a method
for further enhancing glucose control in these devices. Previous approaches
have been shown to reduce patient risk and improve time spent in the target
range when compared to classical control algorithms, but are prone to
instability in the learning process, often resulting in the selection of unsafe
actions. This work presents an evaluation of offline RL as a means for
developing clinically effective dosing policies without the need for patient
interaction. This paper examines the utility of BCQ, CQL and TD3-BC in managing
the blood glucose of nine virtual patients within the UVA/Padova glucose
dynamics simulator. When trained on less than a tenth of the data required by
online RL approaches, this work shows that offline RL can significantly
increase time in the healthy blood glucose range when compared to the strongest
state-of-art baseline. This is achieved without any associated increase in low
blood glucose events. Offline RL is also shown to be able to correct for common
and challenging scenarios such as incorrect bolus dosing, irregular meal
timings and sub-optimal training data.
- Abstract(参考訳): ハイブリッドクローズドループシステムは1型糖尿病(T1D)患者のケアの未来を表す。
これらの装置は通常、単純な制御アルゴリズムを使用して、健康な範囲で血糖値を維持するのに最適なインスリン量を選択する。
オンライン強化学習(RL)は、これらのデバイスにおけるグルコース制御をさらに強化する方法として利用されてきた。
従来のアプローチは、古典的な制御アルゴリズムと比較して患者リスクを減らし、目標範囲に費やした時間を改善することが示されているが、学習過程において不安定になりがちであり、多くの場合、安全でない行動を選択する。
本研究は、患者との相互作用を必要とせず、臨床的に効果的な投与ポリシーを開発する手段として、オフラインRLの評価を行う。
本稿では, UVA/Padova 血糖動態シミュレータにおいて, 血液グルコース管理におけるBCQ, CQL, TD3-BCの有用性を検討した。
オンラインのRLアプローチで必要とされるデータのうち10分の1以下をトレーニングすると、オフラインのRLは、最先端の最先端のベースラインと比較して、健康な血糖値の範囲の時間を大幅に増加させることができる。
これは血糖値の低下を伴わずに達成される。
オフラインrlは、不正確なボラス投与、不規則な食事のタイミング、副最適化のトレーニングデータなど、一般的な挑戦的なシナリオを修正できることも示されている。
関連論文リスト
- From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [50.80532910808962]
GluFormerは、トランスフォーマーアーキテクチャに基づく生体医学的時間的データの生成基盤モデルである。
GluFormerは5つの地理的領域にまたがる4936人を含む15の異なる外部データセットに一般化されている。
今後4年間の健康状態も予測できる。
論文 参考訳(メタデータ) (2024-08-20T13:19:06Z) - DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning [61.10299147201369]
本稿では,Wild デバイス制御エージェントをトレーニングするための新しい自律型 RL 手法である DigiRL を提案する。
VLMベースの評価器を備えた,スケーラブルで並列化可能なAndroid学習環境を構築する。
我々はAndroid-in-the-Wildデータセットを使用してDigiRLの有効性を実証し、RLでトレーニングした1.3B VLMは49.5%の絶対改善を実現した。
論文 参考訳(メタデータ) (2024-06-14T17:49:55Z) - Using Reinforcement Learning to Simplify Mealtime Insulin Dosing for
People with Type 1 Diabetes: In-Silico Experiments [0.40792653193642503]
1型糖尿病(T1D)の患者は、食事時に最適なインスリン摂取量を計算するのに苦労する。
定性食事(QM)戦略に対応する最適な食事関連インスリン投与を推奨するRLエージェントを提案する。
論文 参考訳(メタデータ) (2023-09-17T01:34:02Z) - Self-Supervised Pretraining Improves Performance and Inference
Efficiency in Multiple Lung Ultrasound Interpretation Tasks [65.23740556896654]
肺超音波検査における複数分類課題に適用可能なニューラルネットワーク特徴抽出器を,自己指導型プレトレーニングで作成できるかどうかを検討した。
3つの肺超音波のタスクを微調整すると、事前訓練されたモデルにより、各テストセットの受信操作曲線(AUC)における平均クロスタスク面積は、それぞれ0.032と0.061に改善された。
論文 参考訳(メタデータ) (2023-09-05T21:36:42Z) - Basal-Bolus Advisor for Type 1 Diabetes (T1D) Patients Using Multi-Agent
Reinforcement Learning (RL) Methodology [0.0]
本稿では,1型糖尿病(T1D)患者におけるパーソナライズされたグルコース制御のための新しいマルチエージェント強化学習(RL)手法を提案する。
本発明の方法は、血液グルコース(BG)代謝モデルと、ベーサル・ボールス・アドバイザとして作用するマルチエージェントソフトアクター・クリティックRLモデルとからなるクローズドループシステムを用いる。
以上の結果から,RLをベースとしたベーサル・ボルス・アドバイザは血糖コントロールを著しく改善し,血糖変動を低減し,目標範囲内での時間を短縮することが示された。
論文 参考訳(メタデータ) (2023-07-17T23:50:51Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Building Brains: Subvolume Recombination for Data Augmentation in Large
Vessel Occlusion Detection [56.67577446132946]
この戦略をデータから学ぶためには、標準的なディープラーニングベースのモデルに対して、大規模なトレーニングデータセットが必要である。
そこで本研究では, 異なる患者から血管木セグメントを組換えることで, 人工的なトレーニングサンプルを生成する方法を提案する。
拡張スキームに則って,タスク固有の入力を入力した3D-DenseNetを用いて,半球間の比較を行う。
論文 参考訳(メタデータ) (2022-05-05T10:31:57Z) - LSTMs and Deep Residual Networks for Carbohydrate and Bolus
Recommendations in Type 1 Diabetes Management [4.01573226844961]
本研究では, LSTMを用いた血糖値予測手法について紹介する。
次に、同じ推奨タスクのための新しいアーキテクチャを導き出します。
OhioT1DMデータセットの実際の患者データを用いた実験的評価は、新しい統合アーキテクチャが以前のLSTMベースのアプローチと良好に比較できることを示している。
論文 参考訳(メタデータ) (2021-03-06T19:06:14Z) - Deep Reinforcement Learning for Closed-Loop Blood Glucose Control [12.989855325491163]
自動血糖コントロールのための強化学習技術を開発した。
30人のシミュレーション患者から得られた2100万時間以上のデータに基づいて、我々のRLアプローチはベースライン制御アルゴリズムより優れています。
論文 参考訳(メタデータ) (2020-09-18T20:15:02Z) - Basal Glucose Control in Type 1 Diabetes using Deep Reinforcement
Learning: An In Silico Validation [16.93692520921499]
単一ホルモン(インスリン)と二重ホルモン(インスリンとグルカゴン)のデリバリーのための新しい深層強化学習モデルを提案する。
成体コホートでは、目標範囲のパーセンテージは77.6%から80.9%に改善した。
青年コホートでは、目標範囲のパーセンテージが55.5%から65.9%に改善され、単一ホルモンが制御された。
論文 参考訳(メタデータ) (2020-05-18T20:13:16Z) - Short Term Blood Glucose Prediction based on Continuous Glucose
Monitoring Data [53.01543207478818]
本研究では,デジタル意思決定支援ツールの入力として連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データを利用する方法について検討する。
短時間の血液グルコース (STBG) 予測において, リカレントニューラルネットワーク (Recurrent Neural Networks, RNN) をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2020-02-06T16:39:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。