論文の概要: MPC-guided Imitation Learning of Neural Network Policies for the
Artificial Pancreas
- arxiv url: http://arxiv.org/abs/2003.01283v1
- Date: Tue, 3 Mar 2020 01:25:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 22:26:08.810469
- Title: MPC-guided Imitation Learning of Neural Network Policies for the
Artificial Pancreas
- Title(参考訳): 人工膵におけるニューラルネットワーク政策のmpc誘導模倣学習
- Authors: Hongkai Chen, Nicola Paoletti, Scott A. Smolka, Shan Lin
- Abstract要約: 我々は、Imitation Learningを用いて神経ネットワークインスリンポリシーを合成するAP制御に新しいアプローチを導入する。
このようなポリシーは計算的に効率的であり、訓練時に完全な状態情報でMPCを計測することで、測定結果を最適な治療決定にマッピングすることができる。
特定の患者モデルの下で訓練されたコントロールポリシーは,患者コホートに対して容易に(モデルパラメータや外乱分布の観点から)一般化できることが示唆された。
- 参考スコア(独自算出の注目度): 7.019683407682642
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Even though model predictive control (MPC) is currently the main algorithm
for insulin control in the artificial pancreas (AP), it usually requires
complex online optimizations, which are infeasible for resource-constrained
medical devices. MPC also typically relies on state estimation, an error-prone
process. In this paper, we introduce a novel approach to AP control that uses
Imitation Learning to synthesize neural-network insulin policies from
MPC-computed demonstrations. Such policies are computationally efficient and,
by instrumenting MPC at training time with full state information, they can
directly map measurements into optimal therapy decisions, thus bypassing state
estimation. We apply Bayesian inference via Monte Carlo Dropout to learn
policies, which allows us to quantify prediction uncertainty and thereby derive
safer therapy decisions. We show that our control policies trained under a
specific patient model readily generalize (in terms of model parameters and
disturbance distributions) to patient cohorts, consistently outperforming
traditional MPC with state estimation.
- Abstract(参考訳): モデル予測制御(MPC)は、現在、人工膵臓(AP)におけるインスリン制御の主要なアルゴリズムであるが、通常は複雑なオンライン最適化を必要とする。
MPCは通常、エラーを起こしやすいプロセスである状態推定に依存する。
本稿では,模倣学習を用いてmpcを用いた実験からニューラルネットワークインスリンポリシを合成する新しいap制御手法を提案する。
このようなポリシーは計算効率が良く、訓練時間にmpcを完全な状態情報で計測することで、最適な治療決定に直接測定をマッピングできるため、状態推定を回避できる。
我々はモンテカルロ・ドロップアウトによるベイズ推定を学習ポリシーに適用し、予測の不確実性を定量化し、より安全な治療決定を導出する。
特定の患者モデルの下で訓練されたコントロールポリシーは,患者コホートに対して容易に(モデルパラメータや外乱分布の観点から)一般化し,従来型MPCの状態を常に上回ることを示す。
関連論文リスト
- Self-Healing Machine Learning: A Framework for Autonomous Adaptation in Real-World Environments [50.310636905746975]
実世界の機械学習システムは、基礎となるデータ生成プロセスの分散シフトによって、モデルの性能劣化に遭遇することが多い。
概念のドリフト適応のような既存のシフトへのアプローチは、その理性に依存しない性質によって制限される。
我々はこれらの制限を克服するために自己修復機械学習(SHML)を提案する。
論文 参考訳(メタデータ) (2024-10-31T20:05:51Z) - Dropout MPC: An Ensemble Neural MPC Approach for Systems with Learned Dynamics [0.0]
そこで本研究では,モンテカルロのドロップアウト手法を学習システムモデルに応用した,サンプリングベースアンサンブルニューラルMPCアルゴリズムを提案する。
この手法は一般に複雑な力学を持つ不確実なシステムを対象としており、第一原理から派生したモデルは推論が難しい。
論文 参考訳(メタデータ) (2024-06-04T17:15:25Z) - Data-Driven Simulator for Mechanical Circulatory Support with Domain Adversarial Neural Process [15.562905335917408]
MCSの既存の機械シミュレータは仮定の単純化に依存しており、患者固有の振る舞いには敏感である。
ニューラルプロセスアーキテクチャを用いて, MCSポンプレベルと不確実性を伴う大動脈圧測定の確率的関係を捉える。
非定常的傾向予測では19%改善した経験的結果から,DANPが臨床医の有効なツールとして確立された。
論文 参考訳(メタデータ) (2024-05-28T19:07:12Z) - Nonlinear sparse variational Bayesian learning based model predictive control with application to PEMFC temperature control [16.703859991393568]
本研究は非線形システムのための非線形スパース変分学習に基づくMPC(NSVB-MPC)を開発する。
変分推論はNSVB-MPCによって予測精度を評価し、システムの不確実性を定量化するために必要な修正を行う。
論文 参考訳(メタデータ) (2024-04-15T07:30:26Z) - Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-04-08T20:02:19Z) - Policy Optimization for Personalized Interventions in Behavioral Health [8.10897203067601]
デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。
患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。
患者システムの状態空間を個別のレベルに分解するDecompPIをダブする新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-21T21:42:03Z) - Safe AI for health and beyond -- Monitoring to transform a health
service [51.8524501805308]
機械学習アルゴリズムの出力を監視するために必要なインフラストラクチャを評価する。
モデルのモニタリングと更新の例を示す2つのシナリオを提示します。
論文 参考訳(メタデータ) (2023-03-02T17:27:45Z) - POETREE: Interpretable Policy Learning with Adaptive Decision Trees [78.6363825307044]
POETREEは、ポリシー学習を解釈するための新しいフレームワークである。
患者の観察と医療史に基づいて、医師の行動を決定する確率的ツリーポリシーを構築する。
これは、リアルおよび合成医療データセットの最先端を上回ります。
論文 参考訳(メタデータ) (2022-03-15T16:50:52Z) - Proximal Reinforcement Learning: Efficient Off-Policy Evaluation in
Partially Observed Markov Decision Processes [65.91730154730905]
医療や教育などの観察データへのオフライン強化学習の適用においては、観察された行動は観測されていない要因に影響される可能性があるという一般的な懸念がある。
ここでは、部分的に観察されたマルコフ決定過程(POMDP)における非政治評価を考慮し、この問題に取り組む。
我々は、近位因果推論の枠組みをPOMDP設定に拡張し、識別が可能となる様々な設定を提供する。
論文 参考訳(メタデータ) (2021-10-28T17:46:14Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Planning as Inference in Epidemiological Models [15.097226158765334]
既存の疫学モデルで推論を行うことにより,感染症対策政策プロセスの一部を自動化する方法を実証する。
本稿では,既存のシミュレータにおける推論を自動化する確率型プログラミング言語の使用について説明する。
論文 参考訳(メタデータ) (2020-03-30T05:10:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。