論文の概要: Beyond Generative AI: World Models for Clinical Prediction, Counterfactuals, and Planning
- arxiv url: http://arxiv.org/abs/2511.16333v1
- Date: Thu, 20 Nov 2025 13:11:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.632537
- Title: Beyond Generative AI: World Models for Clinical Prediction, Counterfactuals, and Planning
- Title(参考訳): ジェネレーティブAIを超えて - 臨床予測、カウンターファクトリティ、計画のための世界モデル
- Authors: Mohammad Areeb Qazi, Maryam Nadeem, Mohammad Yaqub,
- Abstract要約: 世界モデルは、多段階のロールアウト、カウンターファクト評価、計画を可能にするために予測力学を学ぶ。
レビューされたシステムのほとんどはL1-L2を実現しており、L3とレアなL4計画/制御のインスタンスは少ない。
本総説では, 臨床的に堅牢な予測ファースト世界モデルの研究課題について概説する。
- 参考スコア(独自算出の注目度): 2.800335887892072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Healthcare requires AI that is predictive, reliable, and data-efficient. However, recent generative models lack physical foundation and temporal reasoning required for clinical decision support. As scaling language models show diminishing returns for grounded clinical reasoning, world models are gaining traction because they learn multimodal, temporally coherent, and action-conditioned representations that reflect the physical and causal structure of care. This paper reviews World Models for healthcare systems that learn predictive dynamics to enable multistep rollouts, counterfactual evaluation and planning. We survey recent work across three domains: (i) medical imaging and diagnostics (e.g., longitudinal tumor simulation, projection-transition modeling, and Joint Embedding Predictive Architecture i.e., JEPA-style predictive representation learning), (ii) disease progression modeling from electronic health records (generative event forecasting at scale), and (iii) robotic surgery and surgical planning (action-conditioned guidance and control). We also introduce a capability rubric: L1 temporal prediction, L2 action-conditioned prediction, L3 counterfactual rollouts for decision support, and L4 planning/control. Most reviewed systems achieve L1--L2, with fewer instances of L3 and rare L4. We identify cross-cutting gaps that limit clinical reliability; under-specified action spaces and safety constraints, weak interventional validation, incomplete multimodal state construction, and limited trajectory-level uncertainty calibration. This review outlines a research agenda for clinically robust prediction-first world models that integrate generative backbones (transformers, diffusion, VAE) with causal/mechanical foundation for safe decision support in healthcare.
- Abstract(参考訳): 医療は予測的で信頼性があり、データ効率のよいAIを必要とする。
しかし、最近の生成モデルは、臨床決定支援に必要な物理的基盤と時間的推論を欠いている。
スケールする言語モデルが臨床上の理由づけに対するリターンの低下を示すにつれ、世界モデルは、ケアの物理的・因果的構造を反映したマルチモーダル、時間的コヒーレント、行動条件付き表現を学習するため、勢いを増している。
本稿では,多段階のロールアウト,対実評価,計画を可能にするために,予測力学を学習する医療システムのためのワールドモデルについてレビューする。
3つの領域にわたる最近の研究を調査する。
一 医用画像、診断(縦断的腫瘍シミュレーション、投射遷移モデリング、共同埋め込み予測アーキテクチャ、JEPA型予測表現学習等)
二 電子健康記録(大規模発生事象予測)からの疾患進行モデリング及び
三 ロボット手術及び手術計画(動作調和誘導及び制御)
また,L1の時間的予測,L2の動作条件予測,L3の対実的ロールアウトによる意思決定支援,L4の計画/制御などが導入された。
レビューされたほとんどのシステムはL1-L2を達成し、L3とレアL4のインスタンスは少ない。
臨床的信頼性を損なう横断的ギャップ,不特定行動空間と安全性の制約,弱い介入検証,不完全なマルチモーダル状態構築,トラジェクトリレベルの不確実性校正などを特定した。
本総説では、医療における安全な意思決定支援のための因果的/機械的基盤と、生成的バックボーン(トランスフォーマー、拡散、VAE)を統合する臨床的に堅牢な予測ファースト世界モデルの研究課題について概説する。
関連論文リスト
- OncoReason: Structuring Clinical Reasoning in LLMs for Robust and Interpretable Survival Prediction [2.904892426557913]
大規模言語モデル (LLM) は, バイオメディカルNLPにおいて高い性能を示した。
本稿では,自己回帰型LPMと結果予測のための臨床推論を整合させる,統合型マルチタスク学習フレームワークを提案する。
マルチタスク・クリニカル・モデリングにおける推論・アライメントの重要性について検討した。
論文 参考訳(メタデータ) (2025-10-20T13:35:12Z) - SurgeryLSTM: A Time-Aware Neural Model for Accurate and Explainable Length of Stay Prediction After Spine Surgery [44.119171920037196]
選択的脊椎手術における滞在時間(LOS)予測のための機械学習モデルの開発と評価を行った。
我々は,従来のMLモデルと,マスク付き双方向長短期記憶(BiLSTM)であるオペレーショナルLSTMを比較した。
決定係数(R2)を用いて性能を評価し,説明可能なAIを用いて鍵予測器を同定した。
論文 参考訳(メタデータ) (2025-07-15T01:18:28Z) - Keeping Medical AI Healthy: A Review of Detection and Correction Methods for System Degradation [6.781778751487079]
このレビューでは、医療におけるAIシステムの「健康」の監視と維持について、前向きな視点を提示する。
継続的パフォーマンス監視、早期劣化検出、効果的な自己補正メカニズムの緊急ニーズを強調します。
この研究は、ダイナミックな臨床環境における安全な長期展開を維持できる信頼性が高く堅牢な医療AIシステムの開発を導くことを目的としている。
論文 参考訳(メタデータ) (2025-06-20T19:22:07Z) - Will Large Language Models Transform Clinical Prediction? [6.239284099493876]
大規模言語モデル(LLM)は、医療への関心が高まっている。
本解説は,臨床予測モデル(CPM)を診断・予後タスクに応用するためのLSMの可能性を評価するものである。
論文 参考訳(メタデータ) (2025-05-23T17:02:04Z) - Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - Robust and Interpretable Medical Image Classifiers via Concept
Bottleneck Models [49.95603725998561]
本稿では,自然言語の概念を用いた堅牢で解釈可能な医用画像分類器を構築するための新しいパラダイムを提案する。
具体的には、まず臨床概念をGPT-4から検索し、次に視覚言語モデルを用いて潜在画像の特徴を明示的な概念に変換する。
論文 参考訳(メタデータ) (2023-10-04T21:57:09Z) - Safe AI for health and beyond -- Monitoring to transform a health
service [51.8524501805308]
機械学習アルゴリズムの出力を監視するために必要なインフラストラクチャを評価する。
モデルのモニタリングと更新の例を示す2つのシナリオを提示します。
論文 参考訳(メタデータ) (2023-03-02T17:27:45Z) - Foresight -- Deep Generative Modelling of Patient Timelines using
Electronic Health Records [46.024501445093755]
医学史の時間的モデリングは、将来の出来事を予測し、シミュレートしたり、リスクを見積り、代替診断を提案したり、合併症を予測するために使用することができる。
我々は、文書テキストを構造化されたコード化された概念に変換するためにNER+Lツール(MedCAT)を使用する新しいGPT3ベースのパイプラインであるForesightを提示する。
論文 参考訳(メタデータ) (2022-12-13T19:06:00Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。