論文の概要: MedDreamer: Model-Based Reinforcement Learning with Latent Imagination on Complex EHRs for Clinical Decision Support
- arxiv url: http://arxiv.org/abs/2505.19785v1
- Date: Mon, 26 May 2025 10:16:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.347858
- Title: MedDreamer: Model-Based Reinforcement Learning with Latent Imagination on Complex EHRs for Clinical Decision Support
- Title(参考訳): MedDreamer: 臨床診断支援のための複雑筋電図を用いたモデルベース強化学習
- Authors: Qianyi Xu, Gousia Habib, Dilruk Perera, Mengling Feng,
- Abstract要約: 決定支援システムは通常、離散化と計算に頼り、臨界時間力学を歪曲し、決定品質を劣化させる。
既存の治療レコメンデーションシステムは、モデルフリーであり、オフラインデータのみに基づいて訓練されている。
パーソナライズされた治療レコメンデーションのための2相モデルベースRLフレームワークであるMedDreamerを提案する。
- 参考スコア(独自算出の注目度): 3.8382507197481144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Timely and personalized treatment decisions are essential across a wide range of healthcare settings where patient responses vary significantly and evolve over time. Clinical data used to support these decisions are often irregularly sampled, sparse, and noisy. Existing decision support systems commonly rely on discretization and imputation, which can distort critical temporal dynamics and degrade decision quality. Moreover, they often overlook the clinical significance of irregular recording frequencies, filtering out patterns in how and when data is collected. Reinforcement Learning (RL) is a natural fit for clinical decision-making, enabling sequential, long-term optimization in dynamic, uncertain environments. However, most existing treatment recommendation systems are model-free and trained solely on offline data, making them sample-inefficient, sensitive to data quality, and poorly generalizable across tasks or cohorts. To address these limitations, we propose MedDreamer, a two-phase model-based RL framework for personalized treatment recommendation. MedDreamer uses a world model with an Adaptive Feature Integration (AFI) module to effectively model irregular, sparse clinical data. Through latent imagination, it simulates plausible patient trajectories to enhance learning, refining its policy using a mix of real and imagined experiences. This enables learning policies that go beyond suboptimal historical decisions while remaining grounded in clinical data. To our knowledge, this is the first application of latent imagination to irregular healthcare data. Evaluations on sepsis and mechanical ventilation (MV) treatment using two large-scale EHR datasets show that MedDreamer outperforms both model-free and model-based baselines in clinical outcomes and off-policy metrics.
- Abstract(参考訳): タイムリーでパーソナライズされた治療決定は、患者の反応が大きく変化し、時間とともに進化する幅広い医療環境において不可欠である。
これらの決定を支持するために使われる臨床データは、しばしば不規則にサンプリングされ、スパースで、うるさい。
既存の意思決定支援システムは通常、離散化と計算に頼っており、重要な時間的ダイナミクスを歪ませたり、意思決定品質を低下させたりすることができる。
さらに、不規則な記録周波数の臨床的意義を見落とし、データの収集方法とタイミングのパターンをフィルタリングすることが多い。
強化学習(Reinforcement Learning, RL)は臨床的な意思決定に適しており、動的で不確実な環境での逐次的かつ長期の最適化を可能にする。
しかし、既存の治療レコメンデーションシステムは、オフラインデータのみに基づいてモデルフリーで訓練されており、サンプル非効率で、データ品質に敏感で、タスクやコホート間での一般化が不十分である。
これらの制約に対処するために、パーソナライズされた治療レコメンデーションのための2相モデルベースのRLフレームワークであるMedDreamerを提案する。
MedDreamerは、アダプティブ・フィーチャー・インテグレーション(AFI)モジュールを備えた世界モデルを使用して、不規則でスパースな臨床データを効果的にモデル化する。
忍耐力のある想像を通じて、プラウチブルな患者軌道をシミュレートし、学習を強化し、実体験と想像体験の混合を使ってポリシーを洗練する。
これにより、臨床データに基礎を置いている間、最適な歴史的決定を超える学習ポリシーが可能になる。
我々の知る限り、これは不規則な医療データに潜伏する想像力の最初の応用である。
2つの大規模EMHデータセットを用いた敗血症および機械的換気(MV)治療の評価は、MedDreamerが臨床的結果と非政治指標において、モデルフリーベースラインとモデルベースラインの両方を上回っていることを示している。
関連論文リスト
- An Efficient Contrastive Unimodal Pretraining Method for EHR Time Series Data [35.943089444017666]
本稿では,長期臨床経過データに適した比較事前学習法を提案する。
本モデルでは, 臨床医が患者の症状についてより深い知見を得られるように, 欠損測定をインプットする能力を示す。
論文 参考訳(メタデータ) (2024-10-11T19:05:25Z) - How Deep is your Guess? A Fresh Perspective on Deep Learning for Medical Time-Series Imputation [6.547981908229007]
アーキテクチャとフレームワークのバイアスがモデルのパフォーマンスにどのように影響するかを示します。
実験では、プリプロセッシングと実装の選択に基づいて、最大20%の性能変化を示す。
我々は,現在の深層計算法と医療要件の相違点を同定する。
論文 参考訳(メタデータ) (2024-07-11T12:33:28Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Optimal discharge of patients from intensive care via a data-driven
policy learning framework [58.720142291102135]
退院課題は、退院期間の短縮と退院決定後の退院や死亡のリスクとの不確実なトレードオフに対処することが重要である。
本研究は、このトレードオフを捉えるためのエンドツーエンドの汎用フレームワークを導入し、最適放電タイミング決定を推奨する。
データ駆動型アプローチは、患者の生理的状態を捉えた同種で離散的な状態空間表現を導出するために用いられる。
論文 参考訳(メタデータ) (2021-12-17T04:39:33Z) - The Medkit-Learn(ing) Environment: Medical Decision Modelling through
Simulation [81.72197368690031]
医用シーケンシャルな意思決定に特化して設計された新しいベンチマークスイートを提案する。
Medkit-Learn(ing) Environmentは、高忠実度合成医療データに簡単かつ簡単にアクセスできるPythonパッケージである。
論文 参考訳(メタデータ) (2021-06-08T10:38:09Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Longitudinal modeling of MS patient trajectories improves predictions of
disability progression [2.117653457384462]
本研究は, 実世界の患者データから情報を最適に抽出する作業に対処する。
本研究では,患者軌跡モデリングに適した機械学習手法を用いることで,患者の障害進行を2年間の地平線で予測できることを示す。
文献で利用可能なモデルと比較して、この研究はMS病の進行予測に最も完全な患者履歴を使用する。
論文 参考訳(メタデータ) (2020-11-09T20:48:00Z) - HOLMES: Health OnLine Model Ensemble Serving for Deep Learning Models in
Intensive Care Units [31.368873375366213]
HOLMESは医療アプリケーションのためのオンラインモデルアンサンブルである。
HOLMESは精度/レイテンシのトレードオフを効率的にナビゲートし、アンサンブルを構成し、モデルアンサンブルパイプラインを提供することができることを示す。
HOLMESは, 小児心ICUデータにおけるリスク予測タスクにおいて, 64ベッドシミュレーションにおいて95%以上の予測精度とサブ秒レイテンシで検証した。
論文 参考訳(メタデータ) (2020-08-10T12:38:46Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - DTR Bandit: Learning to Make Response-Adaptive Decisions With Low Regret [59.81290762273153]
動的治療体制 (DTR) はパーソナライズされ適応された多段階の治療計画であり、治療決定を個人の初期特徴に適応させ、その後の各段階における中間結果と特徴に適応させる。
本稿では,探索と搾取を慎重にバランスさせることで,遷移モデルと報酬モデルが線形である場合に,速度-最適後悔を実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-06T13:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。