論文の概要: Distribution-Free Uncertainty Quantification in Mechanical Ventilation Treatment: A Conformal Deep Q-Learning Framework
- arxiv url: http://arxiv.org/abs/2412.12597v1
- Date: Tue, 17 Dec 2024 06:55:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 13:57:53.537456
- Title: Distribution-Free Uncertainty Quantification in Mechanical Ventilation Treatment: A Conformal Deep Q-Learning Framework
- Title(参考訳): 機械的換気処理における分布自由不確かさの定量化:コンフォーマルQラーニングフレームワーク
- Authors: Niloufar Eghbali, Tuka Alhanai, Mohammad M. Ghassemi,
- Abstract要約: 本研究では,集中治療室における機械的換気を最適化するための,分布自由な共形深度Q-ラーニング手法であるConformalDQNを紹介する。
我々はMIMIC-IVデータベースからICU患者記録を用いてモデルを訓練・評価した。
- 参考スコア(独自算出の注目度): 2.5070297884580874
- License:
- Abstract: Mechanical Ventilation (MV) is a critical life-support intervention in intensive care units (ICUs). However, optimal ventilator settings are challenging to determine because of the complexity of balancing patient-specific physiological needs with the risks of adverse outcomes that impact morbidity, mortality, and healthcare costs. This study introduces ConformalDQN, a novel distribution-free conformal deep Q-learning approach for optimizing mechanical ventilation in intensive care units. By integrating conformal prediction with deep reinforcement learning, our method provides reliable uncertainty quantification, addressing the challenges of Q-value overestimation and out-of-distribution actions in offline settings. We trained and evaluated our model using ICU patient records from the MIMIC-IV database. ConformalDQN extends the Double DQN architecture with a conformal predictor and employs a composite loss function that balances Q-learning with well-calibrated probability estimation. This enables uncertainty-aware action selection, allowing the model to avoid potentially harmful actions in unfamiliar states and handle distribution shifts by being more conservative in out-of-distribution scenarios. Evaluation against baseline models, including physician policies, policy constraint methods, and behavior cloning, demonstrates that ConformalDQN consistently makes recommendations within clinically safe and relevant ranges, outperforming other methods by increasing the 90-day survival rate. Notably, our approach provides an interpretable measure of confidence in its decisions, which is crucial for clinical adoption and potential human-in-the-loop implementations.
- Abstract(参考訳): メカニカル換気(Mechanical Ventilation, MV)は、集中治療単位(ICU)において重要な生命維持介入である。
しかし、患者固有の生理的ニーズと、死亡率、死亡率、医療費に影響を及ぼす有害な結果のリスクのバランスをとる複雑さのために、最適な人工呼吸器の設定を決定することは困難である。
本研究は,集中治療室における機械的換気を最適化するための新しい分布自由な共形深度Q-ラーニング手法であるConformalDQNを紹介する。
本手法は,共形予測と深部強化学習を統合することにより,Q値過大評価とオフライン環境における分布外行動の課題に対処し,信頼性の高い不確実性定量化を実現する。
我々はMIMIC-IVデータベースからICU患者記録を用いてモデルを訓練・評価した。
ConformalDQNは、共形予測器でDouble DQNアーキテクチャを拡張し、Q学習とよく校正された確率推定のバランスをとる複合損失関数を用いる。
これにより、不確実性を認識したアクション選択が可能になり、不慣れな状態における潜在的に有害なアクションを回避し、アウト・オブ・ディストリビューションのシナリオにおいてより保守的であることにより、分散シフトを処理することができる。
医師の方針、政策制約手法、行動クローニングなどのベースラインモデルに対する評価は、ConformalDQNが臨床上安全で関連する範囲で常に推奨し、90日間の生存率を高めて他の方法よりも優れていることを示している。
特に本手法は, 臨床応用に不可欠であり, ループ内実装の可能性を秘めている, 決定に対する信頼度を解釈可能な尺度として提示する。
関連論文リスト
- Bayesian Counterfactual Prediction Models for HIV Care Retention with Incomplete Outcome and Covariate Information [0.0]
保持を予測し、保持を最適化するスケジュール決定を推奨するデータ駆動手法が必要である。
予測モデルは、様々なスケジューリングオプションで保持率を推定するのに有用である。
本稿では、これらの複雑さを考慮に入れながら、HIVの維持を予測し、スケジューリングを最適化するオールインワンアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:19:38Z) - The Pitfalls and Promise of Conformal Inference Under Adversarial Attacks [90.52808174102157]
医療画像や自律運転などの安全クリティカルな応用においては、高い敵の堅牢性を維持し、潜在的敵の攻撃から保護することが不可欠である。
敵対的に訓練されたモデルに固有の不確実性に関して、注目すべき知識ギャップが残っている。
本研究では,共形予測(CP)の性能を標準対向攻撃の文脈で検証することにより,ディープラーニングモデルの不確実性について検討する。
論文 参考訳(メタデータ) (2024-05-14T18:05:19Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Uncertainty Quantification in Machine Learning Based Segmentation: A
Post-Hoc Approach for Left Ventricle Volume Estimation in MRI [0.0]
左室容積推定は各種心血管疾患の診断・管理に重要である。
近年の機械学習、特にU-Netのような畳み込みネットワークは、医療画像の自動セグメンテーションを促進している。
本研究では,LV容積予測におけるポストホック不確実性推定のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-30T13:44:55Z) - Towards Reliable Medical Image Segmentation by utilizing Evidential Calibrated Uncertainty [52.03490691733464]
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を利用して、医用画像分割の問題に対する確率と不確実性を明示的にモデル化する。
DeviSには不確実性を考慮したフィルタリングモジュールが組み込まれている。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Towards Safe Mechanical Ventilation Treatment Using Deep Offline
Reinforcement Learning [35.10140674005337]
DeepVentは、保守的なQ-Learning(CQL)ベースのオフラインのDeep Reinforcement Learning(DRL)エージェントで、90日間の生存を促進するための最適な人工呼吸器パラメータを予測することを学習する。
DeepVentは、最近の臨床試験で概説されているように、安全な範囲で換気パラメータを推奨している。
CQLアルゴリズムは、アウト・オブ・ディストリビューション状態/アクションの値推定の過大評価を緩和することで、さらなる安全性を提供する。
論文 参考訳(メタデータ) (2022-10-05T20:41:17Z) - Improving Trustworthiness of AI Disease Severity Rating in Medical
Imaging with Ordinal Conformal Prediction Sets [0.7734726150561088]
統計的に厳密な不確実性定量化の欠如は、AI結果の信頼を損なう重要な要因である。
分布自由不確実性定量化の最近の進歩は、これらの問題に対する実用的な解決策である。
本稿では, 正しい狭窄の重症度を含むことが保証される順序予測セットを形成する手法を実証する。
論文 参考訳(メタデータ) (2022-07-05T18:01:20Z) - Distribution-Free Federated Learning with Conformal Predictions [0.0]
フェデレートラーニングは、患者のプライバシーを維持しながら、別々の機関のデータセットを活用することを目的としている。
キャリブレーションの低さと解釈可能性の欠如は、フェデレートされたモデルの臨床実践への広範な展開を妨げる可能性がある。
本稿では,適応型コンフォメーション・フレームワークを連携学習に組み込むことにより,これらの課題に対処することを提案する。
論文 参考訳(メタデータ) (2021-10-14T18:41:17Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Interpretable Off-Policy Evaluation in Reinforcement Learning by
Highlighting Influential Transitions [48.91284724066349]
強化学習におけるオフ政治評価は、医療や教育などの領域における将来の成果を改善するために観察データを使用する機会を提供する。
信頼区間のような従来の尺度は、ノイズ、限られたデータ、不確実性のために不十分である可能性がある。
我々は,人間専門家が政策評価評価評価の妥当性を分析できるように,ハイブリッドAIシステムとして機能する手法を開発した。
論文 参考訳(メタデータ) (2020-02-10T00:26:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。