論文の概要: Efficient Variance-reduced Estimation from Generative EHR Models: The SCOPE and REACH Estimators
- arxiv url: http://arxiv.org/abs/2602.03730v1
- Date: Tue, 03 Feb 2026 16:49:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.585778
- Title: Efficient Variance-reduced Estimation from Generative EHR Models: The SCOPE and REACH Estimators
- Title(参考訳): 生成型EHRモデルからの効率よい変動推定:SCOPEとREACH推定器
- Authors: Luke Solo, Matthew B. A. McDermott, William F. Parker, Bashar Ramadan, Michael C. Burkhart, Brett K. Beaulieu-Jones,
- Abstract要約: トークン化された電子健康記録タイムラインを用いてトレーニングした生成モデルは、臨床結果の予測を約束する。
既存のアプローチには、患者のリスクレベルを低く区別するスパース推定分布、極端な計算コスト、サンプリング分散の3つの重要な制限がある。
本稿では,予測条件ハザード(REACH)のSCOPE(Sum of Conditional Outcome Probability Estimator)とリスク推定(Sum of Conditional Probability Estimator)の2つの新しい推定手法を提案する。
- 参考スコア(独自算出の注目度): 1.0765331200875645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative models trained using self-supervision of tokenized electronic health record (EHR) timelines show promise for clinical outcome prediction. This is typically done using Monte Carlo simulation for future patient trajectories. However, existing approaches suffer from three key limitations: sparse estimate distributions that poorly differentiate patient risk levels, extreme computational costs, and high sampling variance. We propose two new estimators: the Sum of Conditional Outcome Probability Estimator (SCOPE) and Risk Estimation from Anticipated Conditional Hazards (REACH), that leverage next-token probability distributions discarded by standard Monte Carlo. We prove both estimators are unbiased and that REACH guarantees variance reduction over Monte Carlo sampling for any model and outcome. Empirically, on hospital mortality prediction in MIMIC-IV using the ETHOS-ARES framework, SCOPE and REACH match 100-sample Monte Carlo performance using only 10-11 samples (95% CI: [9,11]), representing a ~10x reduction in inference cost without degrading calibration. For ICU admission prediction, efficiency gains are more modest (~1.2x), which we attribute to the outcome's lower "spontaneity," a property we characterize theoretically and empirically. These methods substantially improve the feasibility of deploying generative EHR models in resource-constrained clinical settings.
- Abstract(参考訳): トークン化電子健康記録(EHR)タイムラインの自己監督を用いてトレーニングした生成モデルは、臨床結果予測の可能性を示唆している。
これは典型的には、将来の患者軌道のモンテカルロシミュレーションを用いて行われる。
しかし、既存のアプローチには、患者のリスクレベルを低く区別する低い推定分布、極端な計算コスト、サンプリング分散の3つの重要な制限がある。
本稿では,予測条件ハザード(REACH)のSCOPE(Sum of Conditional Outcome Probability Estimator)とリスク推定(Sum of Conditional Probability Estimator)の2つの新しい推定手法を提案する。
両推定器は非バイアスであり、REACHはモンテカルロサンプリングのモデルと結果に対する分散還元を保証していることを証明している。
ETHOS-ARESフレームワークを用いたMIMIC-IVの病院死亡予測では,SCOPEとREACHは10-11サンプル(95% CI: [9,11])のみを用いて100サンプルのモンテカルロ性能と一致し,キャリブレーションを低下させることなく約10倍の推論コストの削減を図った。
ICUの入場予測では、効率の利得はより穏やか(~1.2x)であり、これは結果の「自発性」が低いためである。
これらの手法は, 資源制約された臨床環境において, 生成型EHRモデルをデプロイする可能性を大幅に改善する。
関連論文リスト
- A Generative Framework for Causal Estimation via Importance-Weighted Diffusion Distillation [55.53426007439564]
観察データから個別化された治療効果を推定することは因果推論における中心的な課題である。
逆確率重み付け(IPW)は、この問題に対するよく確立された解決策であるが、現代のディープラーニングフレームワークへの統合は依然として限られている。
本稿では,拡散モデルの事前学習と重み付きスコア蒸留を組み合わせた新しい生成フレームワークであるIWDDを提案する。
論文 参考訳(メタデータ) (2025-05-16T17:00:52Z) - A Novel Characterization of the Population Area Under the Risk Coverage Curve (AURC) and Rates of Finite Sample Estimators [22.231565523932286]
AURC(Area Under the Risk-Coverage Curve)は、SCシステムの性能を評価するための最前線評価指標として登場した。
有限サンプルシナリオに対する実験的なAURCプラグイン推定器を導出する。
複数のデータセットにまたがる実験により,推定器の有効性を実証的に検証した。
論文 参考訳(メタデータ) (2024-10-20T11:14:51Z) - Bayesian calibration of stochastic agent based model via random forest [1.4447019135112433]
エージェントベースモデル(ABM)は、疫学におけるアウトブレイクと介入をモデル化するための優れたフレームワークを提供する。
これらのモデルは通常、高度にパラメータ化されており、予測性能の正確な校正が必要である。
本稿では,ABMの評価を高速化するために,ランダム森林を用いた代理モデリング手法を提案する。
論文 参考訳(メタデータ) (2024-06-27T20:50:06Z) - High Precision Causal Model Evaluation with Conditional Randomization [10.23470075454725]
因果誤差を推定するための新しい低分散推定器(ペア推定器)を提案する。
モデルと真の実験効果の両方に同じIPW推定器を適用することにより、IPWによる分散を効果的にキャンセルし、より小さな分散を実現する。
提案手法は,IPW推定器自体の複雑な変更を伴わずに,条件付きランダム化設定における因果推論モデルを評価するための,単純かつ強力な解を提供する。
論文 参考訳(メタデータ) (2023-11-03T13:22:27Z) - Quantifying predictive uncertainty of aphasia severity in stroke patients with sparse heteroscedastic Bayesian high-dimensional regression [47.1405366895538]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Forecast reconciliation for vaccine supply chain optimization [61.13962963550403]
ワクチンサプライチェーン最適化は階層的な時系列予測の恩恵を受けることができる。
異なる階層レベルの予測は、上位レベルの予測が下位レベルの予測の総和と一致しないときに不整合となる。
我々は2010年から2021年にかけてのGSKの販売データを階層的時系列としてモデル化し,ワクチン販売予測問題に取り組む。
論文 参考訳(メタデータ) (2023-05-02T14:34:34Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - STELAR: Spatio-temporal Tensor Factorization with Latent Epidemiological
Regularization [76.57716281104938]
我々は,多くの地域の流行傾向を同時に予測するテンソル法を開発した。
stelarは離散時間差分方程式のシステムを通じて潜在時間正規化を組み込むことで長期予測を可能にする。
我々は、カウンティレベルと州レベルのCOVID-19データの両方を用いて実験を行い、このモデルが流行の興味深い潜伏パターンを識別できることを示します。
論文 参考訳(メタデータ) (2020-12-08T21:21:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。