論文の概要: Agentifying Patient Dynamics within LLMs through Interacting with Clinical World Model
- arxiv url: http://arxiv.org/abs/2605.14723v1
- Date: Thu, 14 May 2026 11:50:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.801026
- Title: Agentifying Patient Dynamics within LLMs through Interacting with Clinical World Model
- Title(参考訳): 臨床世界モデルとの相互作用によるLCM内の患者動態の抑制
- Authors: Minghao Wu, Yuting Yan, Zhenyang Cai, Ke Ji, Chuangsen Fang, Ziying Sheng, Xidong Wang, Rongsheng Wang, Hejia Zhang, Shuang Li, Benyou Wang, Hongyuan Zha,
- Abstract要約: 敗血症治療推奨のための世界モデル拡張LDMエージェントであるSepsisAgentを紹介する。
SepsisAgentは、学習された臨床世界モデルを使用して、候補の流体圧薬の介入下での患者の反応をシミュレートする。
- 参考スコア(独自算出の注目度): 57.78184285979881
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sepsis management in the ICU requires sequential treatment decisions under rapidly evolving patient physiology. Although large language models (LLMs) encode broad clinical knowledge and can reason over guidelines, they are not inherently grounded in action-conditioned patient dynamics. We introduce SepsisAgent, a world model-augmented LLM agent for sepsis treatment recommendation. SepsisAgent uses a learned Clinical World Model to simulate patient responses under candidate fluid--vasopressor interventions, and follows a propose--simulate--refine workflow before committing to a prescription. We first show that world-model access alone yields inconsistent LLM decision performance, motivating agent-specific training. We then train SepsisAgent through a three-stage curriculum: patient-dynamics supervised fine-tuning, propose--simulate--refine behavior cloning, and world-model-based agentic reinforcement learning. On MIMIC-IV sepsis trajectories, SepsisAgent outperforms all traditional RL and LLM-based baselines in off-policy value while achieving the best safety profile under guideline adherence and unsafe-action metrics. Further analysis shows that repeated interaction with the Clinical World Model enables the agent to learn regularities in patient evolution, which remain useful even when simulator access is removed.
- Abstract(参考訳): ICUのシープシス管理は、急速に発展する患者の生理学の下でのシーケンシャルな治療決定を必要とする。
大きな言語モデル(LLM)は、幅広い臨床知識を符号化し、ガイドラインを解釈することができるが、それらは本質的に、アクション条件の患者力学に基礎を置いていない。
敗血症治療推奨のための世界モデル拡張LDMエージェントであるSepsisAgentを紹介する。
SepsisAgentは、学習された臨床世界モデルを使用して、候補の流体-血管圧薬の介入の下で患者の反応をシミュレートし、処方薬をコミットする前にワークフローをシミュレートする提案に従う。
まず、世界モデルへのアクセスだけでは、エージェント固有のトレーニングを動機付ける、一貫性のないLCM決定性能が得られることを示す。
次に,セプシスアジェントを3段階のカリキュラムでトレーニングする。患者力学による微調整,提案-シミュレート-リファインな行動クローニング,および世界モデルに基づくエージェント強化学習である。
MIMIC-IVのセプシストラジェクトリでは、SepsisAgentは従来のRLおよびLLMベースのベースライン全てを非政治価値で上回り、ガイドラインの順守とアンセーフアクションの指標の下で最高の安全プロファイルを達成している。
さらに分析した結果, 臨床世界モデルとの繰り返しの相互作用により, シミュレーターアクセスを除去しても有用である患者進化の規則性を学ぶことができることがわかった。
関連論文リスト
- Learning POMDP World Models from Observations with Language-Model Priors [52.11151769796862]
部分的に観測可能なマルコフ決定プロセス(POMDP)は、内部世界モデルのための柔軟なモデリングクラスを提供する。
先行知識を活用することで,言語モデルがコストのかかる相互作用を低減できるかどうかを問う。
我々は,emphPinductor が LLM ベースの POMDP 学習手法の性能とサンプル効率に一致することを示す。
論文 参考訳(メタデータ) (2026-05-13T16:18:15Z) - MedSAM-Agent: Empowering Interactive Medical Image Segmentation with Multi-turn Agentic Reinforcement Learning [53.37068897861388]
MedSAM-Agentは、対話的なセグメンテーションを多段階の自律的な意思決定プロセスとして再構築するフレームワークである。
マルチターン・エンド・ツー・エンドの成果検証を統合した2段階のトレーニングパイプラインを開発した。
6つの医療モダリティと21のデータセットにわたる実験は、MedSAM-Agentが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-03T09:47:49Z) - A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - How many patients could we save with LLM priors? [1.8421433205488897]
多施設臨床試験における有害事象の階層的ベイズモデリングのための新しい枠組みを提案する。
我々の手法は,事前学習された大言語モデル(LLM)を用いて,モデルから事前情報を直接取得する。
この方法論は、より効率的で専門家にインフォームドされた臨床試験設計の道を開く。
論文 参考訳(メタデータ) (2025-09-04T14:23:35Z) - Organ-Agents: Virtual Human Physiology Simulator via LLMs [66.40796430669158]
オルガン-エージェント(Organ-Agents)は、LDM駆動のエージェントを介して人間の生理学をシミュレートする多エージェントフレームワークである。
症例は7,134例,コントロール7,895例で,9系統および125変数にわたる高分解能トラジェクトリを作成した。
臓器抗原は4,509人の保留患者に対して高いシミュレーション精度を達成し, システムごとのMSE0.16とSOFA系重症度層間の堅牢性を示した。
論文 参考訳(メタデータ) (2025-08-20T01:58:45Z) - Are Large Language Models Dynamic Treatment Planners? An In Silico Study from a Prior Knowledge Injection Angle [3.0391297540732545]
インシリコ1型糖尿病シミュレーターにおいて,大型言語モデル (LLM) を動的インスリン投与剤として評価した。
以上の結果より, ゼロショットプロンプトを慎重に設計することで, より小型のLCMが同等あるいは優れた臨床成績を達成できることが示唆された。
LLMは、チェーン・オブ・シンドロームで刺激された時に過度にアグレッシブなインスリン投与など、顕著な制限を呈する。
論文 参考訳(メタデータ) (2025-08-06T13:46:02Z) - DoctorAgent-RL: A Multi-Agent Collaborative Reinforcement Learning System for Multi-Turn Clinical Dialogue [18.814676128928234]
大規模言語モデル (LLMs) は, バイオメディカルな質問応答の分野で優れた能力を発揮してきたが, 実際の臨床研究への応用はいまだに課題に直面している。
我々は,医療相談を不確実性下での動的意思決定プロセスとしてモデル化する,強化学習(RL)に基づくマルチエージェント協調フレームワークであるOursを提案する。
本手法は,医療資源の配分を最適化し,労働力不足を緩和する戦略の草分けとして,時間的プレッシャーによる誤診リスクの低減,複雑な症例に対する臨床医の解放,医療資源配分の最適化,労働力不足の緩和など,極めて実践的な価値を示す。
論文 参考訳(メタデータ) (2025-05-26T07:48:14Z) - Self-Evolving Multi-Agent Simulations for Realistic Clinical Interactions [26.167030665482184]
MedAgentSimは、医師、患者、測定エージェントによる、オープンソースのシミュレートされた臨床環境である。
従来のアプローチとは違って,本フレームワークでは,マルチターン会話を通じて医師が患者と活発に交流する必要がある。
我々は、モデルが診断戦略を反復的に洗練できる自己改善メカニズムを組み込んだ。
論文 参考訳(メタデータ) (2025-03-28T17:59:53Z) - Medchain: Bridging the Gap Between LLM Agents and Clinical Practice with Interactive Sequence [68.05876437208505]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。