論文の概要: A Causal Framework for Evaluating ICU Discharge Strategies
- arxiv url: http://arxiv.org/abs/2603.25397v1
- Date: Thu, 26 Mar 2026 12:42:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.29634
- Title: A Causal Framework for Evaluating ICU Discharge Strategies
- Title(参考訳): ICU放電戦略評価のための因果的枠組み
- Authors: Sagar Nagaraj Simha, Juliette Ortholand, Dave Dongelmans, Jessica D. Workum, Olivier W. M. Thijssens, Ameen Abu-Hanna, Giovanni Cinà,
- Abstract要約: これは3つの挑戦を伴う最適な停止シナリオとして考えられる。
我々はg-formula Pythonパッケージの実装を一般化し、停止戦略を評価するためのフレームワークを提供する。
完全なオープンソースパイプラインでは、パブリックICUデータセットであるMIMIC-IVにこのアプローチを適用します。
- 参考スコア(独自算出の注目度): 0.42507371584973264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this applied paper, we address the difficult open problem of when to discharge patients from the Intensive Care Unit. This can be conceived as an optimal stopping scenario with three added challenges: 1) the evaluation of a stopping strategy from observational data is itself a complex causal inference problem, 2) the composite objective is to minimize the length of intervention and maximize the outcome, but the two cannot be collapsed to a single dimension, and 3) the recording of variables stops when the intervention is discontinued. Our contributions are two-fold. First, we generalize the implementation of the g-formula Python package, providing a framework to evaluate stopping strategies for problems with the aforementioned structure, including positivity and coverage checks. Second, with a fully open-source pipeline, we apply this approach to MIMIC-IV, a public ICU dataset, demonstrating the potential for strategies that improve upon current care.
- Abstract(参考訳): 本稿では,集中治療室から患者を退院させる際の課題について述べる。
これは、次の3つの課題を伴う最適な停止シナリオとして考えられる。
1)観測データからの停止戦略の評価は,それ自体複雑な因果推論問題である。
2 複合目的は、介入期間を最小化し、その結果を最大化することであるが、両者は1次元に崩壊することができない。
3)介入が終了すると変数の記録が停止する。
私たちの貢献は2倍です。
まず、g-formula Pythonパッケージの実装を一般化し、上記の構造上の問題に対して、肯定性やカバレッジチェックを含む停止戦略を評価するためのフレームワークを提供する。
第2に、完全なオープンソースパイプラインで、このアプローチをパブリックICUデータセットであるMIMIC-IVに適用し、現在のケアを改善する戦略の可能性を示す。
関連論文リスト
- Off-policy estimation with adaptively collected data: the power of online learning [20.023469636707635]
適応的に収集したデータを用いて, 処理効果の線形関数を推定する。
本稿では,オンライン学習を通じて治療効果の一連の推定を生成できる一般還元方式を提案する。
論文 参考訳(メタデータ) (2024-11-19T10:18:27Z) - Provably Efficient Exploration in Inverse Constrained Reinforcement Learning [12.178081346315523]
逆制約強化学習(Inverse Constrained Reinforcement Learning)は、複雑な環境で実現可能な制約を回復するための一般的な解法である。
本稿では,このギャップを埋めるため,効率的なサンプリングを行うための戦略的探索フレームワークを提案する。
効率的な制約推論を実現するための探索アルゴリズムを2つ導入する。
論文 参考訳(メタデータ) (2024-09-24T10:48:13Z) - Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care [46.2482873419289]
我々は、より信頼性の高いクリティカルケアポリシーを得るための深いQ-ラーニングアプローチを導入する。
本手法を,集中治療室のシミュレーション環境と実際の健康記録を用いて,オフライン・オフ・セッティングで評価した。
論文 参考訳(メタデータ) (2023-06-13T18:02:57Z) - Provable Offline Preference-Based Reinforcement Learning [95.00042541409901]
本研究では,PbRL(Preference-based Reinforcement Learning)の問題について,人間のフィードバックを用いて検討する。
我々は、報酬が軌道全体にわたって定義できる一般的な報酬設定について考察する。
我々は, 軌道毎の集中性によって上界に拘束できる新しい単極集中係数を導入する。
論文 参考訳(メタデータ) (2023-05-24T07:11:26Z) - Worst-Case Control and Learning Using Partial Observations Over an
Infinite Time-Horizon [2.456909016197174]
安全クリティカルなサイバー物理システムは、敵の混乱に対する堅牢な制御戦略と不確実性をモデル化する必要がある。
有限時間地平線上での最悪の割引コストを最小限に抑えるため,部分観測システムにおける近似制御と学習の枠組みを提案する。
論文 参考訳(メタデータ) (2023-03-28T21:40:06Z) - Strategyproof Decision-Making in Panel Data Settings and Beyond [34.55170300009607]
複数単位(またはエージェント)の繰り返し測定において、意思決定者がうるさく感じるパネルデータを用いた意思決定の問題を考える。
まず,戦略的介入政策が存在する必要十分条件を特定し,その存在時に簡単な閉じた形態で戦略的防御機構を提供する。
製品販売から18ヶ月にわたって収集した実世界パネルデータを用いて,我々のモデルを実証的に評価した。
論文 参考訳(メタデータ) (2022-11-25T16:56:42Z) - Instance-Dependent Confidence and Early Stopping for Reinforcement
Learning [99.57168572237421]
強化学習(RL)のための様々なアルゴリズムは、その収束率の劇的な変動を問題構造の関数として示している。
この研究は、観察されたパフォーマンスの違いについて、textitexを説明する保証を提供する。
次の自然なステップは、これらの理論的保証を実際に有用なガイドラインに変換することです。
論文 参考訳(メタデータ) (2022-01-21T04:25:35Z) - Proximal Reinforcement Learning: Efficient Off-Policy Evaluation in
Partially Observed Markov Decision Processes [65.91730154730905]
医療や教育などの観察データへのオフライン強化学習の適用においては、観察された行動は観測されていない要因に影響される可能性があるという一般的な懸念がある。
ここでは、部分的に観察されたマルコフ決定過程(POMDP)における非政治評価を考慮し、この問題に取り組む。
我々は、近位因果推論の枠組みをPOMDP設定に拡張し、識別が可能となる様々な設定を提供する。
論文 参考訳(メタデータ) (2021-10-28T17:46:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。