論文の概要: Towards Safe Mechanical Ventilation Treatment Using Deep Offline
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2210.02552v1
- Date: Wed, 5 Oct 2022 20:41:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 17:13:27.348144
- Title: Towards Safe Mechanical Ventilation Treatment Using Deep Offline
Reinforcement Learning
- Title(参考訳): 深部オフライン強化学習による安全機械換気処理を目指して
- Authors: Flemming Kondrup, Thomas Jiralerspong, Elaine Lau, Nathan de Lara,
Jacob Shkrob, My Duc Tran, Doina Precup, Sumana Basu
- Abstract要約: DeepVentは、保守的なQ-Learning(CQL)ベースのオフラインのDeep Reinforcement Learning(DRL)エージェントで、90日間の生存を促進するための最適な人工呼吸器パラメータを予測することを学習する。
DeepVentは、最近の臨床試験で概説されているように、安全な範囲で換気パラメータを推奨している。
CQLアルゴリズムは、アウト・オブ・ディストリビューション状態/アクションの値推定の過大評価を緩和することで、さらなる安全性を提供する。
- 参考スコア(独自算出の注目度): 35.10140674005337
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mechanical ventilation is a key form of life support for patients with
pulmonary impairment. Healthcare workers are required to continuously adjust
ventilator settings for each patient, a challenging and time consuming task.
Hence, it would be beneficial to develop an automated decision support tool to
optimize ventilation treatment. We present DeepVent, a Conservative Q-Learning
(CQL) based offline Deep Reinforcement Learning (DRL) agent that learns to
predict the optimal ventilator parameters for a patient to promote 90 day
survival. We design a clinically relevant intermediate reward that encourages
continuous improvement of the patient vitals as well as addresses the challenge
of sparse reward in RL. We find that DeepVent recommends ventilation parameters
within safe ranges, as outlined in recent clinical trials. The CQL algorithm
offers additional safety by mitigating the overestimation of the value
estimates of out-of-distribution states/actions. We evaluate our agent using
Fitted Q Evaluation (FQE) and demonstrate that it outperforms physicians from
the MIMIC-III dataset.
- Abstract(参考訳): 機械的換気は肺機能障害患者の生命維持の重要な形態である。
医療従事者は、患者ごとに人工呼吸器の設定を継続的に調整する必要がある。
したがって、換気処理を最適化する自動意思決定支援ツールを開発することは有益である。
我々は,90日間の生存を促進するために,患者が最適な人工呼吸器パラメータを予測することを学習する,保守的Q-Learning(CQL)ベースのオフラインDeep Reinforcement Learning(DRL)エージェントであるDeepVentを紹介する。
我々は、患者バイタルの継続的な改善を奨励する臨床的に関連する中間報酬をデザインし、rlにおけるスパース報酬の課題に対処する。
最近の臨床試験で概説されているように、deepventは安全範囲内の換気パラメータを推奨している。
cqlアルゴリズムは、分散状態/アクションの値推定の過大評価を緩和することで、さらなる安全性を提供する。
適合q評価 (fqe) を用いて薬剤の評価を行い, mimic-iii データセットより医師に優れることを示した。
関連論文リスト
- Estimating Trustworthy and Safe Optimal Treatment Regimes [56.29769827286456]
我々は、最適な治療体制を特定するための安全かつ解釈可能な枠組みを運用する。
本研究は患者の医療歴と薬理学的特徴に基づくパーソナライズされた治療戦略を支援する。
論文 参考訳(メタデータ) (2023-10-23T19:59:10Z) - Adaptive Multi-Agent Deep Reinforcement Learning for Timely Healthcare
Interventions [14.79027898310755]
マルチエージェント深部強化学習(DRL)を用いた新しいAI駆動型患者監視フレームワークを提案する。
アプローチでは複数の学習エージェントをデプロイし,心拍数,呼吸量,温度などの生理的特徴をモニタする。
提案する多エージェントDRLフレームワークの性能を,2つのデータセットから実世界の生理・運動データを用いて評価した。
論文 参考訳(メタデータ) (2023-09-20T00:42:08Z) - Deep Attention Q-Network for Personalized Treatment Recommendation [1.6631602844999724]
パーソナライズされた治療レコメンデーションのためのDeep Attention Q-Networkを提案する。
深い強化学習フレームワーク内のTransformerアーキテクチャは、過去のすべての患者の観察を効率的に取り入れている。
実世界の敗血症と急性低血圧コホートにおけるモデルの評価を行い、最先端モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2023-07-04T07:00:19Z) - Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning
Approach to Critical Care [68.8204255655161]
我々は、より信頼性の高いクリティカルケアポリシーを得ることができる深いQ-ラーニングアプローチを導入する。
まず、利用可能なすべての報酬に基づいてアクションセットを抽出し、次に、スパース主報酬に基づいて最終モデルを訓練し、制限されたアクションセットで達成する。
論文 参考訳(メタデータ) (2023-06-13T18:02:57Z) - U-PASS: an Uncertainty-guided deep learning Pipeline for Automated Sleep
Staging [61.6346401960268]
プロセスの各段階で不確実性推定を組み込んだ臨床応用に適した,U-PASSと呼ばれる機械学習パイプラインを提案する。
不確実性誘導型ディープラーニングパイプラインを睡眠ステージングの困難な問題に適用し、各ステージにおけるパフォーマンスを体系的に改善することを示す。
論文 参考訳(メタデータ) (2023-06-07T08:27:36Z) - A Deep Learning Approach to Predicting Ventilator Parameters for
Mechanically Ventilated Septic Patients [17.450533813847574]
緊急集中治療室(EICU)における敗血症患者に対する人工呼吸器パラメータの短期的予測に焦点を当てた。
患者固有の深層学習モデルは、どんな重篤な患者でも訓練でき、医師が緊急の医療状況で使うためのインテリジェントな補助役となる。
論文 参考訳(メタデータ) (2022-02-21T04:17:22Z) - Optimal discharge of patients from intensive care via a data-driven
policy learning framework [58.720142291102135]
退院課題は、退院期間の短縮と退院決定後の退院や死亡のリスクとの不確実なトレードオフに対処することが重要である。
本研究は、このトレードオフを捉えるためのエンドツーエンドの汎用フレームワークを導入し、最適放電タイミング決定を推奨する。
データ駆動型アプローチは、患者の生理的状態を捉えた同種で離散的な状態空間表現を導出するために用いられる。
論文 参考訳(メタデータ) (2021-12-17T04:39:33Z) - Machine Learning for Mechanical Ventilation Control (Extended Abstract) [52.65490904484772]
機械的換気はICUで最も広く用いられている治療法の1つである。
人工呼吸器は、所定の気道圧の軌跡に従って患者の肺に空気を注入しなければならない。
データ駆動型アプローチは、人工呼吸器から収集したデータに基づいて訓練されたシミュレーターをトレーニングすることで、侵襲的人工呼吸器を制御することを学ぶ。
この方法は、一般的な強化学習アルゴリズムより優れており、PIDよりも正確で堅牢な物理的換気装置も制御できる。
論文 参考訳(メタデータ) (2021-11-19T20:54:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。