論文の概要: Context-Aware Hospitalization Forecasting Evaluations for Decision Support using LLMs
- arxiv url: http://arxiv.org/abs/2604.23949v1
- Date: Mon, 27 Apr 2026 01:56:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.693819
- Title: Context-Aware Hospitalization Forecasting Evaluations for Decision Support using LLMs
- Title(参考訳): LLMを用いた意思決定支援のためのコンテキスト対応型入院予測評価
- Authors: Rhea Makkuni, Ananya Joshi,
- Abstract要約: 大規模言語モデル(LLM)は、よりリッチなコンテキストを数値予測に組み込むことができる。
これらのモデルがどのようにして、現実の医療環境で安定した、あるいは決定に関連のある予測を生成するべきかは、まだ不明である。
アメリカ合衆国における低・中・高熱化強度60郡を対象とした3つのアプローチの評価を行った。
- 参考スコア(独自算出の注目度): 6.14481021961242
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical and public health experts must make real-time resource decisions, such as expanding hospital bed capacity, based on projected hospitalization trends during large-scale healthcare disruptions (e.g., operational failures or pandemics). Forecasting models can assist in this task by analyzing large volumes of resource-related data at the facility level, but they must be reliable for decision-making under real-world data conditions. Recent work shows that large language models (LLMs) can incorporate richer forms of context into numerical forecasting. Whereas traditional models rely primarily on temporal context (i.e., past observations), LLMs can also leverage non-temporal public health context such as demographic, geographic, and population-level features. However, it remains unclear how these models should be used to produce stable or decision-relevant predictions in real-world healthcare settings. To evaluate how LLMs can be effectively used in this setting, we evaluate three approaches across 60 counties with low-,mid-, and high-hospitalization intensities in the United States: direct LLM-based forecasting, classical time-series models, and a context-augmented hybrid pipeline (HybridARX) that incorporates LLM-derived signals into structured models. Because the goal is operational decision-making rather than error minimization alone, we evaluate performance with bias and lead-lag alignment in addition to standard forecasting metrics. Our results show that HybridARX improves over classical ARX by yielding more stable and better-calibrated forecasts, particularly when incorporating noisy contextual signals into structured time-series models. These findings suggest that, in non-stationary healthcare resource forecasting, LLMs are most useful when embedded within structured hybrid models.
- Abstract(参考訳): 医療・公衆衛生の専門家は、大規模医療破壊(例えば、手術失敗やパンデミック)における病院の入院傾向の予測に基づいて、病院のベッド容量を拡大するなどのリアルタイムなリソース決定をしなければならない。
予測モデルは,施設レベルで大量の資源関連データを解析することにより,この作業を支援することができるが,実世界のデータ条件下での意思決定には信頼性が求められる。
最近の研究は、大規模言語モデル(LLM)がよりリッチな文脈を数値予測に組み込むことができることを示している。
伝統的なモデルは、主に時間的文脈(例えば過去の観察)に依存しているのに対し、LLMは人口統計学、地理的、人口レベルの特徴など、非時間的公衆衛生状況を利用することもできる。
しかし、これらのモデルが、現実の医療環境において、安定した、あるいは決定に関連のある予測を生成するためにどのように使われるべきかは、まだ不明である。
この環境でのLLMの有効利用方法を評価するため、米国内60郡を対象に、直接LLMベースの予測、古典的時系列モデル、LLM由来の信号を構造化モデルに組み込んだコンテキスト拡張ハイブリッドパイプライン(HybridARX)の3つのアプローチを評価した。
目標は、エラーの最小化ではなく、運用上の意思決定であるので、標準的な予測指標に加えて、バイアスとリードラグアライメントによるパフォーマンスを評価します。
以上の結果から,HybridARXはより安定でキャリブレーションのよい予測を得られることで,従来のARXよりも改善されていることがわかった。
これらの結果は、非定常医療資源予測において、LLMは構造化ハイブリッドモデルに組み込む際に最も有用であることが示唆された。
関連論文リスト
- EviCare: Enhancing Diagnosis Prediction with Deep Model-Guided Evidence for In-Context Reasoning [62.61394722212386]
EviCareは、大規模言語モデルにディープモデルガイダンスを統合する、コンテキスト内推論フレームワークである。
LLMのみのベースラインと深層モデルのみのベースラインを2つの実世界のEHRベンチマークで連続的に上回っている。
論文 参考訳(メタデータ) (2026-04-12T04:35:14Z) - PREBA: Surgical Duration Prediction via PCA-Weighted Retrieval-Augmented LLMs and Bayesian Averaging Aggregation [51.96735866702332]
PreBAはPCA重み付き検索とベイズ平均アグリゲーションを統合した検索拡張フレームワークである。
例えば、PreBAはパフォーマンスを大幅に改善し、MAEを最大40%削減し、ゼロショット推論でR2を-0.13から0.62に引き上げる。
論文 参考訳(メタデータ) (2026-02-27T07:19:23Z) - A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - OncoReason: Structuring Clinical Reasoning in LLMs for Robust and Interpretable Survival Prediction [2.904892426557913]
大規模言語モデル (LLM) は, バイオメディカルNLPにおいて高い性能を示した。
本稿では,自己回帰型LPMと結果予測のための臨床推論を整合させる,統合型マルチタスク学習フレームワークを提案する。
マルチタスク・クリニカル・モデリングにおける推論・アライメントの重要性について検討した。
論文 参考訳(メタデータ) (2025-10-20T13:35:12Z) - Beyond Naïve Prompting: Strategies for Improved Zero-shot Context-aided Forecasting with LLMs [57.82819770709032]
大規模言語モデル (LLM) は、na "ive direct prompting" を通じて効果的な文脈支援予測を行うことができる。
ReDPは、明確な推論トレースを抽出することで、解釈可能性を改善し、コンテキスト上でモデルの推論を評価することができる。
CorDPはLLMを活用して、既存の予測をコンテキストで洗練し、現実の予測パイプラインにおける適用性を高める。
IC-DPは、文脈支援予測タスクの歴史的例を即時に組み込むことを提案し、大規模モデルにおいても精度を大幅に向上させる。
論文 参考訳(メタデータ) (2025-08-13T16:02:55Z) - LLM-based Agent Simulation for Maternal Health Interventions: Uncertainty Estimation and Decision-focused Evaluation [30.334268991701727]
エージェントに基づくシミュレーションは複雑な人間の行動のモデル化に不可欠である。
従来のアプローチでは、広範なドメイン知識と大規模なデータセットが必要です。
大規模言語モデル(LLM)は、幅広い世界の知識を活用することで、有望な代替手段を提供する。
論文 参考訳(メタデータ) (2025-03-25T20:24:47Z) - Enhancing In-Hospital Mortality Prediction Using Multi-Representational Learning with LLM-Generated Expert Summaries [3.5508427067904864]
ICU患者の院内死亡率(IHM)予測は、時間的介入と効率的な資源配分に重要である。
本研究は、構造化された生理データと臨床ノートをLarge Language Model(LLM)によって生成された専門家要約と統合し、IHM予測精度を向上させる。
論文 参考訳(メタデータ) (2024-11-25T16:36:38Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。
本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T16:35:30Z) - Prompting Large Language Models for Zero-Shot Clinical Prediction with
Structured Longitudinal Electronic Health Record Data [7.815738943706123]
大規模言語モデル(LLM)は、伝統的に自然言語処理に向いている。
本研究では, GPT-4 などの LLM の EHR データへの適応性について検討する。
EHRデータの長手性、スパース性、知識を注入した性質に対応するため、本研究は特定の特徴を考慮に入れている。
論文 参考訳(メタデータ) (2024-01-25T20:14:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。