論文の概要: Towards Safe Mechanical Ventilation Treatment Using Deep Offline
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2210.02552v1
- Date: Wed, 5 Oct 2022 20:41:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 17:13:27.348144
- Title: Towards Safe Mechanical Ventilation Treatment Using Deep Offline
Reinforcement Learning
- Title(参考訳): 深部オフライン強化学習による安全機械換気処理を目指して
- Authors: Flemming Kondrup, Thomas Jiralerspong, Elaine Lau, Nathan de Lara,
Jacob Shkrob, My Duc Tran, Doina Precup, Sumana Basu
- Abstract要約: DeepVentは、保守的なQ-Learning(CQL)ベースのオフラインのDeep Reinforcement Learning(DRL)エージェントで、90日間の生存を促進するための最適な人工呼吸器パラメータを予測することを学習する。
DeepVentは、最近の臨床試験で概説されているように、安全な範囲で換気パラメータを推奨している。
CQLアルゴリズムは、アウト・オブ・ディストリビューション状態/アクションの値推定の過大評価を緩和することで、さらなる安全性を提供する。
- 参考スコア(独自算出の注目度): 35.10140674005337
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mechanical ventilation is a key form of life support for patients with
pulmonary impairment. Healthcare workers are required to continuously adjust
ventilator settings for each patient, a challenging and time consuming task.
Hence, it would be beneficial to develop an automated decision support tool to
optimize ventilation treatment. We present DeepVent, a Conservative Q-Learning
(CQL) based offline Deep Reinforcement Learning (DRL) agent that learns to
predict the optimal ventilator parameters for a patient to promote 90 day
survival. We design a clinically relevant intermediate reward that encourages
continuous improvement of the patient vitals as well as addresses the challenge
of sparse reward in RL. We find that DeepVent recommends ventilation parameters
within safe ranges, as outlined in recent clinical trials. The CQL algorithm
offers additional safety by mitigating the overestimation of the value
estimates of out-of-distribution states/actions. We evaluate our agent using
Fitted Q Evaluation (FQE) and demonstrate that it outperforms physicians from
the MIMIC-III dataset.
- Abstract(参考訳): 機械的換気は肺機能障害患者の生命維持の重要な形態である。
医療従事者は、患者ごとに人工呼吸器の設定を継続的に調整する必要がある。
したがって、換気処理を最適化する自動意思決定支援ツールを開発することは有益である。
我々は,90日間の生存を促進するために,患者が最適な人工呼吸器パラメータを予測することを学習する,保守的Q-Learning(CQL)ベースのオフラインDeep Reinforcement Learning(DRL)エージェントであるDeepVentを紹介する。
我々は、患者バイタルの継続的な改善を奨励する臨床的に関連する中間報酬をデザインし、rlにおけるスパース報酬の課題に対処する。
最近の臨床試験で概説されているように、deepventは安全範囲内の換気パラメータを推奨している。
cqlアルゴリズムは、分散状態/アクションの値推定の過大評価を緩和することで、さらなる安全性を提供する。
適合q評価 (fqe) を用いて薬剤の評価を行い, mimic-iii データセットより医師に優れることを示した。
関連論文リスト
- Distribution-Free Uncertainty Quantification in Mechanical Ventilation Treatment: A Conformal Deep Q-Learning Framework [2.5070297884580874]
本研究では,集中治療室における機械的換気を最適化するための,分布自由な共形深度Q-ラーニング手法であるConformalDQNを紹介する。
我々はMIMIC-IVデータベースからICU患者記録を用いてモデルを訓練・評価した。
論文 参考訳(メタデータ) (2024-12-17T06:55:20Z) - Machine learning-based algorithms for at-home respiratory disease monitoring and respiratory assessment [45.104212062055424]
本研究の目的は、在宅呼吸器疾患のモニタリングと評価を容易にする機械学習ベースのアルゴリズムを開発することである。
健常成人30名を対象に, 呼吸圧, 血流, 胸腹部周囲の動的計測を行った。
ランダムフォレスト分類器、ロジスティック回帰、サポートベクターマシン(SVM)など、さまざまな機械学習モデルをトレーニングし、呼吸タイプを予測する。
論文 参考訳(メタデータ) (2024-09-05T02:14:31Z) - Methodology for Interpretable Reinforcement Learning for Optimizing Mechanical Ventilation [2.3349787245442966]
機械的換気は、コントロールされた空気と酸素を患者の肺に供給する重要な生命維持介入である。
人工呼吸器制御戦略を最適化するためのデータ駆動アプローチがいくつか提案されているが、多くの場合、解釈可能性やドメイン知識との整合性が欠如している。
本稿では,統合医療システムの一部として機械的換気制御を改善することを目的とした,解釈型強化学習(RL)の方法論を提案する。
論文 参考訳(メタデータ) (2024-04-03T23:07:24Z) - Deep Attention Q-Network for Personalized Treatment Recommendation [1.6631602844999724]
パーソナライズされた治療レコメンデーションのためのDeep Attention Q-Networkを提案する。
深い強化学習フレームワーク内のTransformerアーキテクチャは、過去のすべての患者の観察を効率的に取り入れている。
実世界の敗血症と急性低血圧コホートにおけるモデルの評価を行い、最先端モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2023-07-04T07:00:19Z) - Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care [46.2482873419289]
我々は、より信頼性の高いクリティカルケアポリシーを得るための深いQ-ラーニングアプローチを導入する。
本手法を,集中治療室のシミュレーション環境と実際の健康記録を用いて,オフライン・オフ・セッティングで評価した。
論文 参考訳(メタデータ) (2023-06-13T18:02:57Z) - U-PASS: an Uncertainty-guided deep learning Pipeline for Automated Sleep
Staging [61.6346401960268]
プロセスの各段階で不確実性推定を組み込んだ臨床応用に適した,U-PASSと呼ばれる機械学習パイプラインを提案する。
不確実性誘導型ディープラーニングパイプラインを睡眠ステージングの困難な問題に適用し、各ステージにおけるパフォーマンスを体系的に改善することを示す。
論文 参考訳(メタデータ) (2023-06-07T08:27:36Z) - Optimal discharge of patients from intensive care via a data-driven
policy learning framework [58.720142291102135]
退院課題は、退院期間の短縮と退院決定後の退院や死亡のリスクとの不確実なトレードオフに対処することが重要である。
本研究は、このトレードオフを捉えるためのエンドツーエンドの汎用フレームワークを導入し、最適放電タイミング決定を推奨する。
データ駆動型アプローチは、患者の生理的状態を捉えた同種で離散的な状態空間表現を導出するために用いられる。
論文 参考訳(メタデータ) (2021-12-17T04:39:33Z) - Machine Learning for Mechanical Ventilation Control (Extended Abstract) [52.65490904484772]
機械的換気はICUで最も広く用いられている治療法の1つである。
人工呼吸器は、所定の気道圧の軌跡に従って患者の肺に空気を注入しなければならない。
データ駆動型アプローチは、人工呼吸器から収集したデータに基づいて訓練されたシミュレーターをトレーニングすることで、侵襲的人工呼吸器を制御することを学ぶ。
この方法は、一般的な強化学習アルゴリズムより優れており、PIDよりも正確で堅牢な物理的換気装置も制御できる。
論文 参考訳(メタデータ) (2021-11-19T20:54:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。