論文の概要: PREBA: Surgical Duration Prediction via PCA-Weighted Retrieval-Augmented LLMs and Bayesian Averaging Aggregation
- arxiv url: http://arxiv.org/abs/2603.13275v2
- Date: Thu, 19 Mar 2026 01:00:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.254864
- Title: PREBA: Surgical Duration Prediction via PCA-Weighted Retrieval-Augmented LLMs and Bayesian Averaging Aggregation
- Title(参考訳): PreBA: PCA-Weighted Retrieval-Augmented LLMとBayesian Averaging Aggregationによる手術期間予測
- Authors: Wanyin Wu, Kanxue Li, Baosheng Yu, Haoyun Zhao, Yibing Zhan, Dapeng Tao, Hua Jin,
- Abstract要約: PreBAはPCA重み付き検索とベイズ平均アグリゲーションを統合した検索拡張フレームワークである。
例えば、PreBAはパフォーマンスを大幅に改善し、MAEを最大40%削減し、ゼロショット推論でR2を-0.13から0.62に引き上げる。
- 参考スコア(独自算出の注目度): 51.96735866702332
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate prediction of surgical duration is pivotal for hospital resource management. Although recent supervised learning approaches-from machine learning (ML) to fine-tuned large language models (LLMs)-have shown strong performance, they remain constrained by the need for high-quality labeled data and computationally intensive training. In contrast, zero-shot LLM inference offers a promising training-free alternative but it lacks grounding in institution-specific clinical context (e.g., local demographics and case-mix distributions), making its predictions clinically misaligned and prone to instability. To address these limitations, we present PREBA, a retrieval-augmented framework that integrates PCA-weighted retrieval and Bayesian averaging aggregation to ground LLM predictions in institution-specific clinical evidence and statistical priors. The core of PREBA is to construct an evidence-based prompt for the LLM, comprising (1) the most clinically similar historical surgical cases and (2) clinical statistical priors. To achieve this, PREBA first encodes heterogeneous clinical features into a unified representation space enabling systematic retrieval. It then performs PCA-weighted retrieval to identify clinically relevant historical cases, which form the evidence context supplied to the LLM. Finally, PREBA applies Bayesian averaging to fuse multi-round LLM predictions with population-level statistical priors, yielding calibrated and clinically plausible duration estimates. We evaluate PREBA on two real-world clinical datasets using three state-of-the-art LLMs, including Qwen3, DeepSeek-R1, and HuatuoGPT-o1. PREBA significantly improves performance-for instance, reducing MAE by up to 40% and raising R^2 from -0.13 to 0.62 over zero-shot inference-and it achieves accuracy competitive with supervised ML methods, demonstrating strong effectiveness and generalization.
- Abstract(参考訳): 手術期間の正確な予測は, 病院の資源管理において重要である。
近年,機械学習 (ML) から微調整された大規模言語モデル (LLM) への教師付き学習アプローチは高い性能を示したが,高品質なラベル付きデータと計算集約型トレーニングの必要性に制約が残されている。
対照的に、ゼロショットLPM推論は、有望なトレーニングなしの代替手段を提供するが、制度固有の臨床コンテキスト(例えば、地域人口統計学、ケースミックス分布)の基盤を欠いているため、その予測が臨床的に不一致し、不安定になりやすい。
これらの制約に対処するため,PCA重み付き検索とベイズ平均集約を統合した検索強化フレームワークであるPreBAを,機関別臨床証拠および統計的先行例における地上LEM予測に適用した。
PreBAの核心は、(1)最も臨床的に類似した外科的症例と(2)臨床統計的先行例からなる、LCMのためのエビデンスベースのプロンプトを構築することである。
これを実現するため、PreBAはまず異種の臨床特徴を、体系的な検索を可能にする統一表現空間に符号化する。
その後、PCA重み付き検索を行い、臨床に関係のある歴史的症例を特定し、LSMに供給されるエビデンスコンテキストを形成する。
最終的にPreBAは、ベイズ平均化を適用して、人口レベルの統計的事前予測と多ラウンドLEM予測を融合させ、校正され、臨床的に妥当な期間を推定する。
我々は,Qwen3,DeepSeek-R1,HuatuoGPT-o1を含む最先端の3つのLSMを用いて,実世界の2つの臨床データセット上でPreBAを評価した。
例えば、PreBAはパフォーマンスを大幅に改善し、MAEを最大40%削減し、ゼロショット推論よりも-0.13から0.62にR^2を上昇させ、教師付きML手法と競合し、強力な有効性と一般化を示す。
関連論文リスト
- A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - OncoReason: Structuring Clinical Reasoning in LLMs for Robust and Interpretable Survival Prediction [2.904892426557913]
大規模言語モデル (LLM) は, バイオメディカルNLPにおいて高い性能を示した。
本稿では,自己回帰型LPMと結果予測のための臨床推論を整合させる,統合型マルチタスク学習フレームワークを提案する。
マルチタスク・クリニカル・モデリングにおける推論・アライメントの重要性について検討した。
論文 参考訳(メタデータ) (2025-10-20T13:35:12Z) - Cross-Representation Benchmarking in Time-Series Electronic Health Records for Clinical Outcome Prediction [44.23284500920266]
このベンチマークは、2つの異なる臨床環境におけるデータキュレーションと評価を標準化する。
実験によると、イベントストリームモデルは、常に最強のパフォーマンスを提供する。
特徴選択戦略は臨床環境に適応する必要がある。
論文 参考訳(メタデータ) (2025-10-10T09:03:47Z) - CLaDMoP: Learning Transferrable Models from Successful Clinical Trials via LLMs [14.116060944536011]
CLaDMoPは,臨床治験結果予測のための新しい事前学習手法である。
CLaDMoPは、新しい多層核融合技術により、試験の適性基準を軽量な薬物分子分岐にリンクする。
CLaDMoPはPR-AUCを最大10.5%改善し、OC-AUCを3.6%改善し、MEXA-CTPに匹敵するF1スコアを得た。
論文 参考訳(メタデータ) (2025-05-24T05:45:32Z) - Enhancing In-Hospital Mortality Prediction Using Multi-Representational Learning with LLM-Generated Expert Summaries [3.5508427067904864]
ICU患者の院内死亡率(IHM)予測は、時間的介入と効率的な資源配分に重要である。
本研究は、構造化された生理データと臨床ノートをLarge Language Model(LLM)によって生成された専門家要約と統合し、IHM予測精度を向上させる。
論文 参考訳(メタデータ) (2024-11-25T16:36:38Z) - Scaling Laws for Predicting Downstream Performance in LLMs [75.28559015477137]
この研究は、性能推定のためのより計算効率のよい指標として、事前学習損失に焦点を当てている。
FLP-Mは、事前トレーニング中に複数のソースからのデータセットを統合する実践的なニーズに対処する、パフォーマンス予測の基本的なアプローチである。
論文 参考訳(メタデータ) (2024-10-11T04:57:48Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。