Fugu-MT 論文翻訳(概要): Offline Reinforcement Learning for Safer Blood Glucose Control in People with Type 1 Diabetes

論文の概要: Offline Reinforcement Learning for Safer Blood Glucose Control in People with Type 1 Diabetes

arxiv url: http://arxiv.org/abs/2204.03376v2
Date: Fri, 5 May 2023 10:04:01 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-08 17:50:35.233504
Title: Offline Reinforcement Learning for Safer Blood Glucose Control in People with Type 1 Diabetes
Title（参考訳）: 1型糖尿病患者における血糖コントロールのためのオフライン強化学習
Authors: Harry Emerson, Matthew Guy and Ryan McConville
Abstract要約: オンライン強化学習(RL)は、糖尿病デバイスにおける血糖コントロールをさらに強化する方法として利用されてきた。本稿では,FDAが承認したUVA/パドバ血糖動態シミュレータで利用可能な30名の仮想的患者の血糖管理におけるBCQ,CQL,TD3-BCの有用性について検討する。オフラインのRLは、61.6 +-0.3%から65.3 +/-0.5%までの健康な血糖値において、最強の最先端のベースラインに比べて有意に上昇する。
参考スコア（独自算出の注目度）: 1.1859913430860336
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The widespread adoption of effective hybrid closed loop systems would represent an important milestone of care for people living with type 1 diabetes (T1D). These devices typically utilise simple control algorithms to select the optimal insulin dose for maintaining blood glucose levels within a healthy range. Online reinforcement learning (RL) has been utilised as a method for further enhancing glucose control in these devices. Previous approaches have been shown to reduce patient risk and improve time spent in the target range when compared to classical control algorithms, but are prone to instability in the learning process, often resulting in the selection of unsafe actions. This work presents an evaluation of offline RL for developing effective dosing policies without the need for potentially dangerous patient interaction during training. This paper examines the utility of BCQ, CQL and TD3-BC in managing the blood glucose of the 30 virtual patients available within the FDA-approved UVA/Padova glucose dynamics simulator. When trained on less than a tenth of the total training samples required by online RL to achieve stable performance, this work shows that offline RL can significantly increase time in the healthy blood glucose range from 61.6 +\- 0.3% to 65.3 +/- 0.5% when compared to the strongest state-of-art baseline (p < 0.001). This is achieved without any associated increase in low blood glucose events. Offline RL is also shown to be able to correct for common and challenging control scenarios such as incorrect bolus dosing, irregular meal timings and compression errors.
Abstract（参考訳）: 効果的なハイブリッドクローズドループシステムの普及は、1型糖尿病(T1D)患者のケアの重要なマイルストーンとなる。これらの装置は通常、単純な制御アルゴリズムを使用して、健康な範囲で血糖値を維持するのに最適なインスリン量を選択する。オンライン強化学習(RL)は、これらのデバイスにおけるグルコース制御をさらに強化する方法として利用されてきた。従来のアプローチは、古典的な制御アルゴリズムと比較して患者リスクを減らし、目標範囲に費やした時間を改善することが示されているが、学習過程において不安定になりがちであり、多くの場合、安全でない行動を選択する。本研究は、トレーニング中の潜在的に危険な患者との相互作用を必要とせず、効果的な服用ポリシーを開発するためのオフラインRLの評価である。本稿では,FDAが承認したUVA/パドバ血糖動態シミュレータで利用可能な30名の仮想的患者の血糖管理におけるBCQ,CQL,TD3-BCの有用性について検討する。オンラインRLが安定した性能を達成するのに必要なトレーニングサンプルの10分の1以下でトレーニングすると、オフラインRLは、最強の最先端のベースライン(p < 0.001)と比較して、61.6 +\- 0.3%から65.3 +/- 0.5%までの健康な血糖値の時間を大幅に増加させることができる。これは血糖値の低下を伴わずに達成される。オフラインRLはまた、不正な食事時間、不規則な食事時間、圧縮エラーなど、一般的な、困難な制御シナリオを修正可能である。

関連論文リスト

Integrating Neural Differential Forecasting with Safe Reinforcement Learning for Blood Glucose Regulation [51.12307713554633]
TSODEは、Thompson RL SmplingとNeural Ordinary Differential Equation forecasterを統合した安全対応のコントローラである。 FDAが承認したUVa/Padovaシミュレータ(adult cohort)では、TSODEは87.9%のタイムインレンジを達成した。
論文参考訳（メタデータ） (2025-11-16T02:11:33Z)
A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。 Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文参考訳（メタデータ） (2025-08-19T14:41:22Z)
Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.1574468325115]
本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文参考訳（メタデータ） (2025-05-23T14:06:42Z)
LLM-Powered Prediction of Hyperglycemia and Discovery of Behavioral Treatment Pathways from Wearables and Diet [6.292642131180376]
食後の血糖値が正常値を超えることが特徴である。食後の血糖動態を理解するための重要な指標は、曲線(AUC)下の後部領域である我々は、センサー駆動の入力を取り込み、高度なデータ処理、大規模言語モデル、トレーニング可能な機械学習モデルを使用する、説明可能な機械学習ソリューションであるGlucoLensを開発した。
論文参考訳（メタデータ） (2025-03-05T22:10:14Z)
From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [50.80532910808962]
GluFormerは、トランスフォーマーアーキテクチャに基づく生体医学的時間的データの生成基盤モデルである。 GluFormerは5つの地理的領域にまたがる4936人を含む15の異なる外部データセットに一般化されている。今後4年間の健康状態も予測できる。
論文参考訳（メタデータ） (2024-08-20T13:19:06Z)
DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning [61.10299147201369]
本稿では,Wild デバイス制御エージェントをトレーニングするための新しい自律型 RL 手法である DigiRL を提案する。 VLMベースの評価器を備えた,スケーラブルで並列化可能なAndroid学習環境を構築する。我々はAndroid-in-the-Wildデータセットを使用してDigiRLの有効性を実証し、RLでトレーニングした1.3B VLMは49.5%の絶対改善を実現した。
論文参考訳（メタデータ） (2024-06-14T17:49:55Z)
Using Reinforcement Learning to Simplify Mealtime Insulin Dosing for People with Type 1 Diabetes: In-Silico Experiments [0.40792653193642503]
1型糖尿病(T1D)の患者は、食事時に最適なインスリン摂取量を計算するのに苦労する。定性食事(QM)戦略に対応する最適な食事関連インスリン投与を推奨するRLエージェントを提案する。
論文参考訳（メタデータ） (2023-09-17T01:34:02Z)
Self-Supervised Pretraining Improves Performance and Inference Efficiency in Multiple Lung Ultrasound Interpretation Tasks [65.23740556896654]
肺超音波検査における複数分類課題に適用可能なニューラルネットワーク特徴抽出器を,自己指導型プレトレーニングで作成できるかどうかを検討した。 3つの肺超音波のタスクを微調整すると、事前訓練されたモデルにより、各テストセットの受信操作曲線(AUC)における平均クロスタスク面積は、それぞれ0.032と0.061に改善された。
論文参考訳（メタデータ） (2023-09-05T21:36:42Z)
Basal-Bolus Advisor for Type 1 Diabetes (T1D) Patients Using Multi-Agent Reinforcement Learning (RL) Methodology [0.0]
本稿では,1型糖尿病(T1D)患者におけるパーソナライズされたグルコース制御のための新しいマルチエージェント強化学習(RL)手法を提案する。本発明の方法は、血液グルコース(BG)代謝モデルと、ベーサル・ボールス・アドバイザとして作用するマルチエージェントソフトアクター・クリティックRLモデルとからなるクローズドループシステムを用いる。以上の結果から,RLをベースとしたベーサル・ボルス・アドバイザは血糖コントロールを著しく改善し,血糖変動を低減し,目標範囲内での時間を短縮することが示された。
論文参考訳（メタデータ） (2023-07-17T23:50:51Z)
Learning to diagnose cirrhosis from radiological and histological labels with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文参考訳（メタデータ） (2023-02-16T17:06:23Z)
Self-supervised contrastive learning of echocardiogram videos enables label-efficient cardiac disease diagnosis [48.64462717254158]
心エコービデオを用いた自己教師型コントラスト学習手法であるエコーCLRを開発した。左室肥大症 (LVH) と大動脈狭窄症 (AS) の分類成績は,EchoCLR の訓練により有意に改善した。 EchoCLRは、医療ビデオの表現を学習する能力に特有であり、SSLがラベル付きデータセットからラベル効率の高い疾患分類を可能にすることを実証している。
論文参考訳（メタデータ） (2022-07-23T19:17:26Z)
Building Brains: Subvolume Recombination for Data Augmentation in Large Vessel Occlusion Detection [56.67577446132946]
この戦略をデータから学ぶためには、標準的なディープラーニングベースのモデルに対して、大規模なトレーニングデータセットが必要である。そこで本研究では, 異なる患者から血管木セグメントを組換えることで, 人工的なトレーニングサンプルを生成する方法を提案する。拡張スキームに則って,タスク固有の入力を入力した3D-DenseNetを用いて,半球間の比較を行う。
論文参考訳（メタデータ） (2022-05-05T10:31:57Z)
LSTMs and Deep Residual Networks for Carbohydrate and Bolus Recommendations in Type 1 Diabetes Management [4.01573226844961]
本研究では, LSTMを用いた血糖値予測手法について紹介する。次に、同じ推奨タスクのための新しいアーキテクチャを導き出します。 OhioT1DMデータセットの実際の患者データを用いた実験的評価は、新しい統合アーキテクチャが以前のLSTMベースのアプローチと良好に比較できることを示している。
論文参考訳（メタデータ） (2021-03-06T19:06:14Z)
Deep Reinforcement Learning for Closed-Loop Blood Glucose Control [12.989855325491163]
自動血糖コントロールのための強化学習技術を開発した。 30人のシミュレーション患者から得られた2100万時間以上のデータに基づいて、我々のRLアプローチはベースライン制御アルゴリズムより優れています。
論文参考訳（メタデータ） (2020-09-18T20:15:02Z)
Basal Glucose Control in Type 1 Diabetes using Deep Reinforcement Learning: An In Silico Validation [16.93692520921499]
単一ホルモン(インスリン)と二重ホルモン(インスリンとグルカゴン)のデリバリーのための新しい深層強化学習モデルを提案する。成体コホートでは、目標範囲のパーセンテージは77.6%から80.9%に改善した。青年コホートでは、目標範囲のパーセンテージが55.5%から65.9%に改善され、単一ホルモンが制御された。
論文参考訳（メタデータ） (2020-05-18T20:13:16Z)
Short Term Blood Glucose Prediction based on Continuous Glucose Monitoring Data [53.01543207478818]
本研究では,デジタル意思決定支援ツールの入力として連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データを利用する方法について検討する。短時間の血液グルコース (STBG) 予測において, リカレントニューラルネットワーク (Recurrent Neural Networks, RNN) をどのように利用できるかを検討する。
論文参考訳（メタデータ） (2020-02-06T16:39:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。