論文の概要: End-to-end Offline Reinforcement Learning for Glycemia Control
- arxiv url: http://arxiv.org/abs/2310.10312v1
- Date: Mon, 16 Oct 2023 11:46:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 14:45:30.238036
- Title: End-to-end Offline Reinforcement Learning for Glycemia Control
- Title(参考訳): 血糖コントロールのためのエンドツーエンドオフライン強化学習
- Authors: Tristan Beolet, Alice Adenis, Erik Huneker, Maxime Louis
- Abstract要約: I型糖尿病における血糖コントロールのためのクローズループシステムは、シミュレーションされた患者に大きく依存している。
我々は、実際の患者データに基づいて訓練されたオフラインRLエージェントを用いて、血糖コントロールを行うことを提案する。
- 参考スコア(独自算出の注目度): 0.27309692684728604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of closed-loop systems for glycemia control in type I
diabetes relies heavily on simulated patients. Improving the performances and
adaptability of these close-loops raises the risk of over-fitting the
simulator. This may have dire consequences, especially in unusual cases which
were not faithfully-if at all-captured by the simulator. To address this, we
propose to use offline RL agents, trained on real patient data, to perform the
glycemia control. To further improve the performances, we propose an end-to-end
personalization pipeline, which leverages offline-policy evaluation methods to
remove altogether the need of a simulator, while still enabling an estimation
of clinically relevant metrics for diabetes.
- Abstract(参考訳): I型糖尿病における血糖コントロールのためのクローズドループシステムの開発はシミュレーション患者に大きく依存している。
これらのクローズループの性能と適応性を改善することで、シミュレータのオーバーフィットのリスクが高まる。
これは、特にシミュレーターによって全キャプチャーで忠実に捉えられていない異常なケースにおいて、恐ろしい結果をもたらす可能性がある。
そこで本研究では,実際の患者データに基づいてトレーニングしたオフラインrlエージェントを用いて血糖コントロールを行うことを提案する。
そこで本研究では,糖尿病の臨床的関連指標を評価しながら,オフライン政策評価手法を用いてシミュレータの必要性を完全に排除するエンド・ツー・エンドのパーソナライズパイプラインを提案する。
関連論文リスト
- Comparative Analysis of LSTM Neural Networks and Traditional Machine Learning Models for Predicting Diabetes Patient Readmission [0.0]
本研究はDiabetes 130-US Hospitalsデータセットを用いて,各種機械学習モデルによる寛解患者の分析と予測を行う。
LightGBMは、XGBoostが首位だったのに対して、従来のモデルとしてはベストだった。
本研究は,予測医療モデリングにおいて,モデル選択,検証,解釈可能性が重要なステップであることを示す。
論文 参考訳(メタデータ) (2024-06-28T15:06:22Z) - Neural Control System for Continuous Glucose Monitoring and Maintenance [0.0]
持続的なグルコースモニタリングと管理のための新しいニューラルコントロールシステムを提供する。
我々のアプローチは、洗練されたニューラルポリシーと微分可能なモデリングによって導かれ、常にリアルタイムでインスリン供給を調整する。
このエンドツーエンドの方法は効率を最大化し、パーソナライズされたケアを提供し、健康状態を改善する。
論文 参考訳(メタデータ) (2024-02-21T14:56:36Z) - The Safety Challenges of Deep Learning in Real-World Type 1 Diabetes
Management [4.107887387754702]
血糖シミュレーションにより、患者に害を与えずに1型糖尿病(T1D)管理戦略を評価できる。
ディープラーニングアルゴリズムは、シミュレータ機能を拡張するための有望な道を提供する。
この研究は、現実世界のデータに基づいて訓練されたディープラーニングアルゴリズムを用いてグルコースダイナミクスをモデル化することの意味について考察する。
論文 参考訳(メタデータ) (2023-10-23T09:25:50Z) - Doubly Robust Proximal Causal Learning for Continuous Treatments [56.05592840537398]
本稿では,カーネルベースの2倍頑健な因果学習推定器を提案する。
オラクル形式は影響関数の一貫した近似であることを示す。
次に、平均二乗誤差の観点から総合収束解析を行う。
論文 参考訳(メタデータ) (2023-09-22T12:18:53Z) - Hybrid Control Policy for Artificial Pancreas via Ensemble Deep
Reinforcement Learning [13.783833824324333]
閉ループグルコース制御の課題に対処するために, 人工膵(HyCPAP)のハイブリッド制御ポリシーを提案する。
FDAが承認したUVA/Padova T1DMシミュレータを用いた広範囲な実験を行った。
本手法は所望のユーグリセミック範囲で過ごす時間が最も多く,低血糖の発生率が最も低い。
論文 参考訳(メタデータ) (2023-07-13T00:53:09Z) - A Conditional Flow Variational Autoencoder for Controllable Synthesis of
Virtual Populations of Anatomy [76.20367415712867]
本稿では,正規化フローを用いた条件付き変分オートエンコーダ(cVAE)を提案する。
2360例の心左心室データを用いた条件流VAEの性能について検討した。
論文 参考訳(メタデータ) (2023-06-26T13:23:52Z) - Adaptive Behavior Cloning Regularization for Stable Offline-to-Online
Reinforcement Learning [80.25648265273155]
オフライン強化学習は、固定データセットから学習することで、環境と対話することなくエージェントの動作を学ぶことができる。
オンラインの微調整中、オフラインからオンラインデータへの突然の分散シフトにより、事前訓練されたエージェントのパフォーマンスが急速に低下する可能性がある。
エージェントの性能と訓練安定性に基づいて,オンラインファインチューニングにおける行動クローンの損失を適応的に評価することを提案する。
実験の結果,提案手法はD4RLベンチマークにおいて,最先端のオフライン-オンライン強化学習性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-10-25T09:08:26Z) - Offline Reinforcement Learning for Safer Blood Glucose Control in People
with Type 1 Diabetes [1.1859913430860336]
オンライン強化学習(RL)は、糖尿病デバイスにおける血糖コントロールをさらに強化する方法として利用されてきた。
本稿では,FDAが承認したUVA/パドバ血糖動態シミュレータで利用可能な30名の仮想的患者の血糖管理におけるBCQ,CQL,TD3-BCの有用性について検討する。
オフラインのRLは、61.6 +-0.3%から65.3 +/-0.5%までの健康な血糖値において、最強の最先端のベースラインに比べて有意に上昇する。
論文 参考訳(メタデータ) (2022-04-07T11:52:12Z) - DeepRite: Deep Recurrent Inverse TreatmEnt Weighting for Adjusting
Time-varying Confounding in Modern Longitudinal Observational Data [68.29870617697532]
時系列データにおける時間変化の相違に対するDeep Recurrent Inverse TreatmEnt重み付け(DeepRite)を提案する。
DeepRiteは、合成データから基底的真理を復元し、実際のデータから偏りのない処理効果を推定する。
論文 参考訳(メタデータ) (2020-10-28T15:05:08Z) - DTR Bandit: Learning to Make Response-Adaptive Decisions With Low Regret [59.81290762273153]
動的治療体制 (DTR) はパーソナライズされ適応された多段階の治療計画であり、治療決定を個人の初期特徴に適応させ、その後の各段階における中間結果と特徴に適応させる。
本稿では,探索と搾取を慎重にバランスさせることで,遷移モデルと報酬モデルが線形である場合に,速度-最適後悔を実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-06T13:03:42Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。