Fugu-MT 論文翻訳(概要): medDreamer: Model-Based Reinforcement Learning with Latent Imagination on Complex EHRs for Clinical Decision Support

論文の概要: medDreamer: Model-Based Reinforcement Learning with Latent Imagination on Complex EHRs for Clinical Decision Support

arxiv url: http://arxiv.org/abs/2505.19785v2
Date: Mon, 04 Aug 2025 13:42:18 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-05 14:07:56.892614
Title: medDreamer: Model-Based Reinforcement Learning with Latent Imagination on Complex EHRs for Clinical Decision Support
Title（参考訳）: medDreamer: 臨床診断支援のための複雑筋電図を用いたモデルベース強化学習
Authors: Qianyi Xu, Gousia Habib, Dilruk Perera, Mengling Feng,
Abstract要約: medDreamerは、パーソナライズされた治療レコメンデーションのための新しいモデルベースの強化学習フレームワークである。不規則なデータから潜伏した患者の状態をシミュレートし、実と想像の軌跡のハイブリッドで訓練された2段階のポリシーを定めている。これは、臨床結果と非政治指標の両方において、モデルフリーおよびモデルベースベースラインを著しく上回る。
参考スコア（独自算出の注目度）: 3.8382507197481144
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Timely and personalized treatment decisions are essential across a wide range of healthcare settings where patient responses can vary significantly and evolve over time. Clinical data used to support these treatment decisions are often irregularly sampled, where missing data frequencies may implicitly convey information about the patient's condition. Existing Reinforcement Learning (RL) based clinical decision support systems often ignore the missing patterns and distort them with coarse discretization and simple imputation. They are also predominantly model-free and largely depend on retrospective data, which could lead to insufficient exploration and bias by historical behaviors. To address these limitations, we propose medDreamer, a novel model-based reinforcement learning framework for personalized treatment recommendation. medDreamer contains a world model with an Adaptive Feature Integration module that simulates latent patient states from irregular data and a two-phase policy trained on a hybrid of real and imagined trajectories. This enables learning optimal policies that go beyond the sub-optimality of historical clinical decisions, while remaining close to real clinical data. We evaluate medDreamer on both sepsis and mechanical ventilation treatment tasks using two large-scale Electronic Health Records (EHRs) datasets. Comprehensive evaluations show that medDreamer significantly outperforms model-free and model-based baselines in both clinical outcomes and off-policy metrics.
Abstract（参考訳）: タイムリーでパーソナライズされた治療決定は、患者の反応が著しく変化し、時間とともに進化する、幅広い医療環境において不可欠である。これらの治療決定を支援するために使用される臨床データは、しばしば不規則にサンプリングされ、欠落したデータ頻度が患者の状態に関する情報を暗黙的に伝達する。既存の強化学習(RL)に基づく臨床意思決定支援システムは、欠落したパターンを無視し、粗い離散化と単純な計算で歪ませることが多い。また、主にモデルフリーであり、主に振り返りのデータに依存しているため、過去の行動による調査や偏見が不十分になる可能性がある。これらの制約に対処するために,パーソナライズされた治療レコメンデーションのための新しいモデルベース強化学習フレームワークであるmedDreamerを提案する。 medDreamerには、不規則なデータから潜在患者の状態をシミュレートするAdaptive Feature Integrationモジュールを備えた世界モデルと、現実と想像された軌道のハイブリッドに基づいてトレーニングされた2フェーズポリシーが含まれている。これにより、実際の臨床データに近づきながら、歴史的臨床決定の準最適性を超えた最適な政策を学ぶことができる。我々は,2つの大規模電子健康記録(EHRs)データセットを用いて,敗血症および機械的換気処理作業におけるメドドレマーの評価を行った。包括的評価から,medDreamerは,臨床結果と非政治指標の両方において,モデルフリーおよびモデルベースベースラインを著しく上回っていることが示された。

関連論文リスト

A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文参考訳（メタデータ） (2026-01-29T18:48:21Z)
LUME-DBN: Full Bayesian Learning of DBNs from Incomplete data in Intensive Care [0.41292255339309664]
不完全データから動的ベイズネットワークを学習するための新しいギブスサンプリング手法を提案する。本手法は,重症心身障害患者のシミュレーションデータと実世界集中治療データの両方を用いて評価した。
論文参考訳（メタデータ） (2025-11-06T13:13:39Z)
Timely Clinical Diagnosis through Active Test Selection [49.091903570068155]
本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。 LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文参考訳（メタデータ） (2025-10-21T18:10:45Z)
An Efficient Contrastive Unimodal Pretraining Method for EHR Time Series Data [35.943089444017666]
本稿では,長期臨床経過データに適した比較事前学習法を提案する。本モデルでは, 臨床医が患者の症状についてより深い知見を得られるように, 欠損測定をインプットする能力を示す。
論文参考訳（メタデータ） (2024-10-11T19:05:25Z)
How Deep is your Guess? A Fresh Perspective on Deep Learning for Medical Time-Series Imputation [6.547981908229007]
アーキテクチャとフレームワークのバイアスがモデルのパフォーマンスにどのように影響するかを示します。実験では、プリプロセッシングと実装の選択に基づいて、最大20%の性能変化を示す。我々は,現在の深層計算法と医療要件の相違点を同定する。
論文参考訳（メタデータ） (2024-07-11T12:33:28Z)
Zero-shot and Few-shot Generation Strategies for Artificial Clinical Records [1.338174941551702]
本研究は,Llama 2 LLMが患者情報を正確に反映した合成医療記録を作成する能力を評価するものである。筆者らは,MIMIC-IVデータセットから得られたデータを用いて,現在史の物語を生成することに重点を置いている。このチェーン・オブ・シークレットのアプローチにより、ゼロショットモデルが、ルージュのメトリクス評価に基づいて、微調整されたモデルと同等の結果が得られることが示唆された。
論文参考訳（メタデータ） (2024-03-13T16:17:09Z)
TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文参考訳（メタデータ） (2023-07-19T12:35:09Z)
Modelling Patient Trajectories Using Multimodal Information [0.0]
本稿では,異なる種類の情報を組み合わせて臨床データの時間的側面を考慮した患者軌跡のモデル化手法を提案する。本手法は, 予期せぬ患者寛解と疾患進行の2つの異なる臨床結果に基づいて検討した。
論文参考訳（メタデータ） (2022-09-09T10:20:54Z)
Bridging the Gap Between Patient-specific and Patient-independent Seizure Prediction via Knowledge Distillation [7.2666838978096875]
既存のアプローチは通常、てんかんの信号の高度にパーソナライズされた特性のために、患者固有の方法でモデルを訓練する。患者固有のモデルは、蒸留された知識と追加のパーソナライズされたデータによって得られる。提案手法を用いて,CHB-MIT sEEGデータベース上で5つの最先端の発作予測法を訓練する。
論文参考訳（メタデータ） (2022-02-25T10:30:29Z)
Optimal discharge of patients from intensive care via a data-driven policy learning framework [58.720142291102135]
退院課題は、退院期間の短縮と退院決定後の退院や死亡のリスクとの不確実なトレードオフに対処することが重要である。本研究は、このトレードオフを捉えるためのエンドツーエンドの汎用フレームワークを導入し、最適放電タイミング決定を推奨する。データ駆動型アプローチは、患者の生理的状態を捉えた同種で離散的な状態空間表現を導出するために用いられる。
論文参考訳（メタデータ） (2021-12-17T04:39:33Z)
The Medkit-Learn(ing) Environment: Medical Decision Modelling through Simulation [81.72197368690031]
医用シーケンシャルな意思決定に特化して設計された新しいベンチマークスイートを提案する。 Medkit-Learn(ing) Environmentは、高忠実度合成医療データに簡単かつ簡単にアクセスできるPythonパッケージである。
論文参考訳（メタデータ） (2021-06-08T10:38:09Z)
Adversarial Sample Enhanced Domain Adaptation: A Case Study on Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。逆生成したサンプルはドメイン適応時に使用される。その結果,本手法の有効性とタスクの一般性が確認された。
論文参考訳（メタデータ） (2021-01-13T03:20:20Z)
Longitudinal modeling of MS patient trajectories improves predictions of disability progression [2.117653457384462]
本研究は, 実世界の患者データから情報を最適に抽出する作業に対処する。本研究では,患者軌跡モデリングに適した機械学習手法を用いることで,患者の障害進行を2年間の地平線で予測できることを示す。文献で利用可能なモデルと比較して、この研究はMS病の進行予測に最も完全な患者履歴を使用する。
論文参考訳（メタデータ） (2020-11-09T20:48:00Z)
HOLMES: Health OnLine Model Ensemble Serving for Deep Learning Models in Intensive Care Units [31.368873375366213]
HOLMESは医療アプリケーションのためのオンラインモデルアンサンブルである。 HOLMESは精度/レイテンシのトレードオフを効率的にナビゲートし、アンサンブルを構成し、モデルアンサンブルパイプラインを提供することができることを示す。 HOLMESは, 小児心ICUデータにおけるリスク予測タスクにおいて, 64ベッドシミュレーションにおいて95%以上の予測精度とサブ秒レイテンシで検証した。
論文参考訳（メタデータ） (2020-08-10T12:38:46Z)
Hemogram Data as a Tool for Decision-making in COVID-19 Management: Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文参考訳（メタデータ） (2020-05-10T01:45:03Z)
DTR Bandit: Learning to Make Response-Adaptive Decisions With Low Regret [59.81290762273153]
動的治療体制 (DTR) はパーソナライズされ適応された多段階の治療計画であり、治療決定を個人の初期特徴に適応させ、その後の各段階における中間結果と特徴に適応させる。本稿では,探索と搾取を慎重にバランスさせることで,遷移モデルと報酬モデルが線形である場合に,速度-最適後悔を実現する新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-05-06T13:03:42Z)
Estimating Counterfactual Treatment Outcomes over Time Through Adversarially Balanced Representations [114.16762407465427]
時間とともに治療効果を推定するためにCRN(Counterfactual Recurrent Network)を導入する。 CRNは、患者履歴のバランスの取れた表現を構築するために、ドメイン敵のトレーニングを使用する。本モデルでは, 正解率の予測と適切な治療時期の選択において, 誤差の低減を図っている。
論文参考訳（メタデータ） (2020-02-10T20:47:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。