論文の概要: EveryQuery: Zero-Shot Clinical Prediction via Task-Conditioned Pretraining over Electronic Health Records
- arxiv url: http://arxiv.org/abs/2603.07900v1
- Date: Mon, 09 Mar 2026 02:45:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:15.351573
- Title: EveryQuery: Zero-Shot Clinical Prediction via Task-Conditioned Pretraining over Electronic Health Records
- Title(参考訳): EveryQuery: 電子カルテ上でのタスク・コンディションによるゼロショット臨床予測
- Authors: Payal Chandak, Gregory Kondas, Isaac Kohane, Matthew McDermott,
- Abstract要約: EHRファウンデーションモデルであるEveryQueryを導入し、タスク条件付き事前トレーニングを通じてゼロショット推論を実現する。
EveryQueryは、ランダムにサンプリングされたクエリタスクと患者コンテキストの組み合わせを事前学習することで、この機能を実現する。
MIMIC-IVでは、EveryQueryは39のランダムサンプリング予測タスクのうち82%で自己回帰ベースラインを上回っている。
- 参考スコア(独自算出の注目度): 1.8268488712787334
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models pretrained on electronic health records (EHR) have demonstrated zero-shot clinical prediction capabilities by generating synthetic patient futures and aggregating statistics over sampled trajectories. However, this autoregressive inference procedure is computationally expensive, statistically noisy, and not natively promptable because users cannot directly condition predictions on specific clinical questions. In this preliminary work, we introduce EveryQuery, an EHR foundation model that achieves zero-shot inference through task-conditioned pre-training. Rather than generating future events, EveryQuery takes as input a patient's history and a structured query specifying a clinical task, and directly estimates the likelihood of the outcome occurring in the future window via a single forward pass. EveryQuery realizes this capability by pre-training over randomly sampled combinations of query tasks and patient contexts, directly training the model to produce correct answers to arbitrary input prompts. This enables zero-shot prediction for any task in the query space without finetuning, linear probing, or trajectory generation. On MIMIC-IV, EveryQuery outperforms an autoregressive baseline on 82% of 39 randomly sampled prediction tasks, with a mean AUC improvement of +0.16 (95% CI: [0.10,0.22]). This advantage remains consistent on tasks that were explicitly held out from the pre-training distribution. Further, EveryQuery's performance gains are most pronounced for rare clinical events, affirming and demonstrating a solution to the fundamental limitation of autoregressive inference for low-prevalence outcomes. However, at present, EveryQuery underperforms on tasks requiring disjunctive reasoning over multiple codes, such as 30-day readmission, exposing a concrete expressiveness limitation of the current query language.
- Abstract(参考訳): エレクトロニック・ヘルス・レコード(EHR)で事前訓練された基礎モデルは、人工的な患者の将来を発生させ、サンプリングされた軌跡の統計を集計することにより、ゼロショット臨床予測能力を実証している。
しかし, この自己回帰推論手法は, 計算コストが高く, 統計的にうるさく, 特定の臨床的問題に対して直接予測を条件付けできないため, ネイティブにアクティベートできない。
本稿では,タスク条件付き事前学習によるゼロショット推論を実現するEMH基盤モデルであるEveryQueryを紹介する。
将来のイベントを生成する代わりに、EveryQueryは患者の履歴と臨床タスクを指定する構造化クエリを入力として取り、単一のフォワードパスを通じて将来のウィンドウで発生する結果の可能性を直接推定する。
EveryQueryは、クエリタスクと患者コンテキストのランダムにサンプリングされた組み合わせを事前学習し、任意のインプットプロンプトに対する正しい回答を生成するためにモデルを直接訓練することで、この機能を実現する。
これにより、クエリ空間内の任意のタスクに対して、微調整、線形探索、トラジェクトリ生成なしでゼロショット予測が可能になる。
MIMIC-IVでは、EveryQueryは39のランダムサンプリング予測タスクの82%で自己回帰ベースラインを上回り、平均的なAUC改善は+0.16(95% CI: [0.10,0.22])である。
この利点は、トレーニング済みのディストリビューションから明示的に切り離されたタスクに一貫している。
さらに、EveryQueryのパフォーマンス向上は稀な臨床イベントにおいて最も顕著であり、低頻度の結果に対する自己回帰推論の根本的な制限に対する解決策を肯定し、実証している。
しかし、現在EveryQueryは、30日間の読み出しなど、複数のコードに対する解離的推論を必要とするタスクにおいて、現在のクエリ言語の具体的な表現性制限を露呈している。
関連論文リスト
- Cross-Representation Benchmarking in Time-Series Electronic Health Records for Clinical Outcome Prediction [44.23284500920266]
このベンチマークは、2つの異なる臨床環境におけるデータキュレーションと評価を標準化する。
実験によると、イベントストリームモデルは、常に最強のパフォーマンスを提供する。
特徴選択戦略は臨床環境に適応する必要がある。
論文 参考訳(メタデータ) (2025-10-10T09:03:47Z) - Zero-shot Medical Event Prediction Using a Generative Pre-trained Transformer on Electronic Health Records [8.575985305475355]
生成事前学習型トランス (GPT) は, EHRにおける時系列データを利用して, 将来の事象を予測できる。
これらのモデルの微調整はタスク固有のパフォーマンスを高めるが、多くの臨床予測タスクに適用するとコストがかかる。
事前訓練された基礎モデルはゼロショット予測設定で使用することができ、結果ごとに微調整された個別モデルに代わるスケーラブルな代替手段を提供する。
論文 参考訳(メタデータ) (2025-03-07T19:26:47Z) - Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training [68.94373533768501]
我々は、知識保持をモデル化し、そのコーパスから事実情報を記憶するための事前学習言語モデルの能力を示し、学習前にそれを推定する原則的手法を導入する。
本稿では,知識周波数,知識特異度,モデルサイズを統合し,クローズドブック質問応答(QA)の精度を予測する情報理論予測器である,サイズ依存型相互情報(SMI)を提案する。
論文 参考訳(メタデータ) (2025-02-06T13:23:53Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - Unsupervised Pre-Training on Patient Population Graphs for Patient-Level
Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。
本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。
提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文 参考訳(メタデータ) (2022-03-23T17:59:45Z) - CSDI: Conditional Score-based Diffusion Models for Probabilistic Time
Series Imputation [107.63407690972139]
Conditional Score-based Diffusion Model for Imputation (CSDI) は、観測データに条件付きスコアベース拡散モデルを利用する新しい時系列計算法である。
CSDIは、一般的なパフォーマンスメトリクスの既存の確率論的計算方法よりも40-70%改善されている。
さらに、Cは最先端の決定論的計算法と比較して誤差を5-20%削減する。
論文 参考訳(メタデータ) (2021-07-07T22:20:24Z) - Pre-training transformer-based framework on large-scale pediatric claims
data for downstream population-specific tasks [3.1580072841682734]
本研究は、小児科のクレームデータセット全体をトレーニングする一般的な事前学習モデルであるClaim Pre-Training(Claim-PT)フレームワークを提案する。
効果的な知識伝達はタスク対応微調整段階を通じて完了する。
我々は100万人以上の患者記録を持つ実世界のクレームデータセットの実験を行った。
論文 参考訳(メタデータ) (2021-06-24T15:25:41Z) - Real-time Prediction for Mechanical Ventilation in COVID-19 Patients
using A Multi-task Gaussian Process Multi-objective Self-attention Network [9.287068570192057]
本報告では, 院内感染患者の機械的換気を要す確率を予測できるロバスト・イン・タイム・予測器を提案する。
新型コロナウイルス患者のリスク予測の課題は、臨床現場で観察された患者のバイタルや検査室の大きなばらつきと不規則なサンプリングにある。
予測タスクを多目的学習フレームワークに設定し、すべての時点におけるリスクスコアを完全に最適化する。
論文 参考訳(メタデータ) (2021-02-01T20:35:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。