論文の概要: IntelliLung: Advancing Safe Mechanical Ventilation using Offline RL with Hybrid Actions and Clinically Aligned Rewards
- arxiv url: http://arxiv.org/abs/2506.14375v1
- Date: Tue, 17 Jun 2025 10:17:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.424556
- Title: IntelliLung: Advancing Safe Mechanical Ventilation using Offline RL with Hybrid Actions and Clinically Aligned Rewards
- Title(参考訳): IntelliLung: オフラインRLとハイブリットアクションと臨床適応リワードによる安全な機械的換気の改善
- Authors: Muhammad Hamza Yousuf, Jason Li, Sahar Vahdati, Raphael Theilen, Jakob Wittenstein, Jens Lehmann,
- Abstract要約: 集中治療室(ICU)における感染性機械換気(Invasive Mechanical ventilation, MV)は重症心疾患患者に対する生命維持療法である
現在の最先端(SOTA)法は、MVアクションのハイブリッドな(連続的で離散的な)性質に苦慮している。
本稿では、離散的な行動空間の課題に対処するために、行動空間削減における先行作業に基づいて構築される最適化を提案する。
- 参考スコア(独自算出の注目度): 6.42339118295049
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Invasive mechanical ventilation (MV) is a life-sustaining therapy for critically ill patients in the intensive care unit (ICU). However, optimizing its settings remains a complex and error-prone process due to patient-specific variability. While Offline Reinforcement Learning (RL) shows promise for MV control, current stateof-the-art (SOTA) methods struggle with the hybrid (continuous and discrete) nature of MV actions. Discretizing the action space limits available actions due to exponential growth in combinations and introduces distribution shifts that can compromise safety. In this paper, we propose optimizations that build upon prior work in action space reduction to address the challenges of discrete action spaces. We also adapt SOTA offline RL algorithms (IQL and EDAC) to operate directly on hybrid action spaces, thereby avoiding the pitfalls of discretization. Additionally, we introduce a clinically grounded reward function based on ventilator-free days and physiological targets, which provides a more meaningful optimization objective compared to traditional sparse mortality-based rewards. Our findings demonstrate that AI-assisted MV optimization may enhance patient safety and enable individualized lung support, representing a significant advancement toward intelligent, data-driven critical care solutions.
- Abstract(参考訳): 侵襲的機械換気(Invasive Mechanical ventilation, MV)は、集中治療室(ICU)の重篤な患者に対する生命維持療法である。
しかし、その設定の最適化は、患者固有の変動性のために複雑でエラーを起こしやすいプロセスのままである。
オフライン強化学習(RL)はMV制御を約束する一方で、現在の最先端(SOTA)手法はMV動作のハイブリッド(連続的かつ離散的)な性質に苦しむ。
アクション空間の離散化は、組み合わせの指数的な成長による利用可能なアクションを制限するとともに、安全性を損なう可能性のある分散シフトを導入する。
本稿では、離散的な行動空間の課題に対処するために、行動空間削減における先行作業に基づいて構築される最適化を提案する。
また,SOTAオフラインRLアルゴリズム(IQLとEDAC)をハイブリッド動作空間に直接適用することで,離散化の落とし穴を回避する。
さらに, 人工呼吸器のない日数と生理的目標に基づく臨床基礎型報酬関数を導入し, 従来のスパース死亡率に基づく報酬と比較して, より有意義な最適化目標を提供する。
以上の結果から,AIによるMV最適化が患者の安全性を高め,個別の肺支援を可能にし,インテリジェントでデータ駆動型クリティカルケアソリューションへの大きな進歩を示す可能性が示唆された。
関連論文リスト
- Distribution-Free Uncertainty Quantification in Mechanical Ventilation Treatment: A Conformal Deep Q-Learning Framework [2.5070297884580874]
本研究では,集中治療室における機械的換気を最適化するための,分布自由な共形深度Q-ラーニング手法であるConformalDQNを紹介する。
我々はMIMIC-IVデータベースからICU患者記録を用いてモデルを訓練・評価した。
論文 参考訳(メタデータ) (2024-12-17T06:55:20Z) - Methodology for Interpretable Reinforcement Learning for Optimizing Mechanical Ventilation [2.3349787245442966]
機械的換気は、コントロールされた空気と酸素を患者の肺に供給する重要な生命維持介入である。
人工呼吸器制御戦略を最適化するためのデータ駆動アプローチがいくつか提案されているが、多くの場合、解釈可能性やドメイン知識との整合性が欠如している。
本稿では,統合医療システムの一部として機械的換気制御を改善することを目的とした,解釈型強化学習(RL)の方法論を提案する。
論文 参考訳(メタデータ) (2024-04-03T23:07:24Z) - End-to-End Breast Cancer Radiotherapy Planning via LMMs with Consistency Embedding [47.360760580820966]
放射線腫瘍学の分野に適した包括的大規模マルチモーダルモデル(LMM)であるRO-LMMを提案する。
このモデルは臨床ワークフロー内の一連のタスクを効果的に管理し、臨床コンテキストの要約、放射線治療計画の提案、計画誘導されたターゲットボリュームセグメンテーションを含む。
クリーン入力処理の整合性を維持しつつ,LMMのノイズ入力に対する堅牢性を向上する,CEFTune(Consistency Embedding Fine-Tuning)技術を提案する。
論文 参考訳(メタデータ) (2023-11-27T14:49:06Z) - Action-Quantized Offline Reinforcement Learning for Robotic Skill
Learning [68.16998247593209]
オフライン強化学習(RL)パラダイムは、静的な行動データセットを、データを収集したポリシーよりも優れたパフォーマンスのポリシーに変換するためのレシピを提供する。
本稿では,アクション量子化のための適応型スキームを提案する。
IQL,CQL,BRACといった最先端のオフラインRL手法が,提案手法と組み合わせることで,ベンチマークのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-10-18T06:07:10Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care [46.2482873419289]
我々は、より信頼性の高いクリティカルケアポリシーを得るための深いQ-ラーニングアプローチを導入する。
本手法を,集中治療室のシミュレーション環境と実際の健康記録を用いて,オフライン・オフ・セッティングで評価した。
論文 参考訳(メタデータ) (2023-06-13T18:02:57Z) - Towards Safe Mechanical Ventilation Treatment Using Deep Offline
Reinforcement Learning [35.10140674005337]
DeepVentは、保守的なQ-Learning(CQL)ベースのオフラインのDeep Reinforcement Learning(DRL)エージェントで、90日間の生存を促進するための最適な人工呼吸器パラメータを予測することを学習する。
DeepVentは、最近の臨床試験で概説されているように、安全な範囲で換気パラメータを推奨している。
CQLアルゴリズムは、アウト・オブ・ディストリビューション状態/アクションの値推定の過大評価を緩和することで、さらなる安全性を提供する。
論文 参考訳(メタデータ) (2022-10-05T20:41:17Z) - Auto-FedRL: Federated Hyperparameter Optimization for
Multi-institutional Medical Image Segmentation [48.821062916381685]
Federated Learning(FL)は、明示的なデータ共有を避けながら協調的なモデルトレーニングを可能にする分散機械学習技術である。
本稿では,Auto-FedRLと呼ばれる,効率的な強化学習(RL)に基づくフェデレーションハイパーパラメータ最適化アルゴリズムを提案する。
提案手法の有効性は,CIFAR-10データセットと2つの実世界の医用画像セグメンテーションデータセットの不均一なデータ分割に対して検証される。
論文 参考訳(メタデータ) (2022-03-12T04:11:42Z) - Maximum Mutation Reinforcement Learning for Scalable Control [25.935468948833073]
強化学習(Reinforcement Learning, RL)は、大規模状態空間に対するデータ効率と最適制御を、スケーラブルな性能で実証している。
本稿では,スケーラブルなRLアルゴリズムであるEvolution-based Soft Actor-Critic (ESAC)を提案する。
論文 参考訳(メタデータ) (2020-07-24T16:29:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。