論文の概要: Realistic CDSS Drug Dosing with End-to-end Recurrent Q-learning for Dual Vasopressor Control
- arxiv url: http://arxiv.org/abs/2510.01508v1
- Date: Wed, 01 Oct 2025 23:02:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.896108
- Title: Realistic CDSS Drug Dosing with End-to-end Recurrent Q-learning for Dual Vasopressor Control
- Title(参考訳): 両圧器制御のための終末Qラーニングによる実効性CDSS薬物投与
- Authors: Will Y. Zou, Jean Feng, Alexandre Kalimouttou, Jennifer Yuntong Zhang, Christopher W. Seymour, Romain Pirracchio,
- Abstract要約: 集中治療室 (ICU) 患者に対して, 薬物服用を最適に学習するためのエンドツーエンドアプローチを開発し, 抗敗血症性ショックに対する治療方針について検討した。
現実的な薬物服用には、離散的、連続的、指向的な服用戦略に対応するアクション空間設計を適用する。
提案手法は,既存の臨床プロトコルと整合しながら,生存率15%以上の改善を達成している。
- 参考スコア(独自算出の注目度): 37.613456891934085
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Reinforcement learning (RL) applications in Clinical Decision Support Systems (CDSS) frequently encounter skepticism from practitioners regarding inoperable dosing decisions. We address this challenge with an end-to-end approach for learning optimal drug dosing and control policies for dual vasopressor administration in intensive care unit (ICU) patients with septic shock. For realistic drug dosing, we apply action space design that accommodates discrete, continuous, and directional dosing strategies in a system that combines offline conservative Q-learning with a novel recurrent modeling in a replay buffer to capture temporal dependencies in ICU time-series data. Our comparative analysis of norepinephrine dosing strategies across different action space formulations reveals that the designed action spaces improve interpretability and facilitate clinical adoption while preserving efficacy. Empirical results1 on eICU and MIMIC demonstrate that action space design profoundly influences learned behavioral policies. The proposed methods achieve improved patient outcomes of over 15% in survival improvement probability, while aligning with established clinical protocols.
- Abstract(参考訳): 臨床決定支援システム (CDSS) における強化学習 (RL) の応用は、操作不能な投与決定に関する実践者からの懐疑にしばしば遭遇する。
集中治療室 (ICU) 患者に対して, 至適の薬物服用と治療方針を学習するためのエンドツーエンドアプローチにより, この問題に対処する。
ICU時系列データの時間依存性を捉えるために、オフラインの保守的Qラーニングとリプレイバッファにおける新たなリカレントモデリングを組み合わせたシステムにおいて、離散的、連続的、方向性的なドージング戦略に対応するアクション空間設計を適用する。
異なる作用空間をまたいだノルエピネフリン投与戦略の比較分析により, 設計された作用空間は解釈性を改善し, 有効性を維持しつつ臨床応用を促進することが明らかとなった。
eICUとMIMICの実証結果1は、行動空間設計が学習行動方針に大きく影響を与えることを示した。
提案手法は,既存の臨床プロトコルと整合しながら,生存率15%以上の改善を達成している。
関連論文リスト
- Distribution-Free Uncertainty Quantification in Mechanical Ventilation Treatment: A Conformal Deep Q-Learning Framework [2.5070297884580874]
本研究では,集中治療室における機械的換気を最適化するための,分布自由な共形深度Q-ラーニング手法であるConformalDQNを紹介する。
我々はMIMIC-IVデータベースからICU患者記録を用いてモデルを訓練・評価した。
論文 参考訳(メタデータ) (2024-12-17T06:55:20Z) - Development and Validation of Heparin Dosing Policies Using an Offline Reinforcement Learning Algorithm [0.7519918949973486]
本研究では,強化学習に基づくパーソナライズされたヘパリン投与ポリシーを提案する。
オフラインRL環境における分配エラーを最小限に抑えるため,バッチ制約ポリシを実装した。
本研究はヘパリン投与の実践を強化し、医学における高度な意思決定支援ツールの開発の前例を確立する。
論文 参考訳(メタデータ) (2024-09-24T05:20:38Z) - Empowering Clinicians with Medical Decision Transformers: A Framework for Sepsis Treatment [5.0005174003014865]
安全クリティカルな環境下での課題を解決するための医療意思決定変換器(MeDT)を提案する。
MeDTは、決定トランスフォーマーアーキテクチャを使用して、薬物投与推奨のポリシーを学ぶ。
MeDTは、患者の医療履歴、治療決定、結果、安定性に対する短期的影響の複雑な依存関係をキャプチャする。
論文 参考訳(メタデータ) (2024-07-28T03:40:00Z) - Safe and Interpretable Estimation of Optimal Treatment Regimes [54.257304443780434]
我々は、最適な治療体制を特定するための安全かつ解釈可能な枠組みを運用する。
本研究は患者の医療歴と薬理学的特徴に基づくパーソナライズされた治療戦略を支援する。
論文 参考訳(メタデータ) (2023-10-23T19:59:10Z) - Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care [46.2482873419289]
我々は、より信頼性の高いクリティカルケアポリシーを得るための深いQ-ラーニングアプローチを導入する。
本手法を,集中治療室のシミュレーション環境と実際の健康記録を用いて,オフライン・オフ・セッティングで評価した。
論文 参考訳(メタデータ) (2023-06-13T18:02:57Z) - Learning Optimal Treatment Strategies for Sepsis Using Offline
Reinforcement Learning in Continuous Space [4.031538204818658]
本稿では,臨床医がリアルタイム治療に最適な基準選択を推奨するのに役立つ,歴史的データに基づく新しい医療決定モデルを提案する。
本モデルでは, オフライン強化学習と深層強化学習を組み合わせることで, 医療における従来の強化学習が環境と相互作用できない問題に対処する。
論文 参考訳(メタデータ) (2022-06-22T16:17:21Z) - Disentangled Counterfactual Recurrent Networks for Treatment Effect
Inference over Time [71.30985926640659]
本稿では,DCRN(Disentangled Counterfactual Recurrent Network)を提案する。
時間とともに治療効果の因果構造に完全にインスパイアされたアーキテクチャでは、予測精度と疾患理解が向上する。
実データとシミュレーションデータの両方において,DCRNが処理応答予測の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-12-07T16:40:28Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - Trajectory Inspection: A Method for Iterative Clinician-Driven Design of
Reinforcement Learning Studies [5.5302127686575435]
モデルベースRL研究において,臨床医を反復的設計プロセスに組み込むための簡単なアプローチであるトラジェクトリ・インスペクション(trajectory inspection)を強調した。
モデルが予想外のアグレッシブな治療を推奨するか、あるいはその推奨から驚くほどポジティブな結果を期待するかを特定します。
論文 参考訳(メタデータ) (2020-10-08T22:03:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。