論文の概要: Robustifying and Selecting Cohort-Appropriate Prognostic Models under Distributional Shifts
- arxiv url: http://arxiv.org/abs/2604.16537v1
- Date: Thu, 16 Apr 2026 21:10:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.059324
- Title: Robustifying and Selecting Cohort-Appropriate Prognostic Models under Distributional Shifts
- Title(参考訳): 分布シフト下におけるコホート近似予測モデルのロバスト化と選択
- Authors: Dimitris Bertsimas, Carol Gao, Angelos G. Koulouras, Georgios Antonios Margonis,
- Abstract要約: 外的検証は、予後モデル評価のための金の標準として広く見なされている。
実験では,外部キャリブレーションの成功が共変数の類似性や検証コホート間の結果に大きく依存するかどうかを検討した。
本稿では,コホート間の予測モデルの輸送性を改善するための2つの戦略を提案する。
- 参考スコア(独自算出の注目度): 3.8031924942083517
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: External validation is widely regarded as the gold standard for prognostic model evaluation. In this study, we challenge the assumption that successful external calibration guarantees model generalizability and propose two complementary strategies to improve transportability of prognostic models across cohorts. Using six real-world surgical cohorts from tertiary academic centers, we tested whether successful external calibration depends largely on similarity in covariates and outcomes between training and validation cohorts, quantified using Kullback-Leibler (KL) divergence, with calibration assessed by the Integrated Calibration Index (ICI). From the model-developer's perspective, we trained the "best-on-average" prognostic model by tuning toward a meta-analysis-derived covariate and outcome distribution as an approximation of the broader target population. From the end-user perspective, we proposed a simple measure for cohort outcome similarity to identify, among published models, the one most suitable for a given target cohort in terms of both calibration and clinical utility. External calibration worsened as distributional mismatch increased. Higher KL divergence was associated with higher ICI in both surgery-alone (Spearman $ρ=0.614$, $p=0.004$) and surgery + adjuvant chemotherapy cohorts (Spearman $ρ=0.738$, $p<0.001$). Meta-analysis-informed weighting improved calibration in most settings without materially affecting discrimination, with the clearest benefit when evaluated on the aggregated external population ($p=0.037$). Models developed in more similar cohorts achieved lower ICI in surgery-alone (Spearman $ρ=0.803$, $p<0.001$) and surgery + adjuvant chemotherapy cohorts (Spearman $ρ=0.737$, $p<0.001$), and provided greater clinical utility on DCA.
- Abstract(参考訳): 外的検証は、予後モデル評価のための金の標準として広く見なされている。
本研究では,外部校正の成功がモデル一般化可能性を保証するという仮定に挑戦し,コホート間の予測モデルの伝達性を改善するための2つの相補的戦略を提案する。
第3次学術研究センターの6つの実世界の外科的コホートを用いて、実験結果と評価コホートとの類似性に大きく依存するかどうかを、統合校正指標(ICI)で評価し、KL(Kulback-Leibler)の偏差を用いて定量化した。
モデル・ディベロッパーの観点から,メタ分析に基づく共変量と結果分布を,より広い対象集団の近似として調整することにより,「平均的ベスト・オン・アベレージ」の予測モデルを訓練した。
エンドユーザーの視点からは,コーホート結果の類似性を簡易に評価し,キャリブレーションと臨床的有用性の両方の観点から,所定の目標コーホートに最も適したモデルと同定した。
分布ミスマッチの増加に伴い、外部キャリブレーションは悪化した。
KLの高次分岐は、単独手術(Spearman $ρ=0.614$, $p=0.004$)と補助化学療法コホート(Spearman $ρ=0.738$, $p<0.001$)の両方において高いICIと関連していた。
メタアナリシスインフォームド重み付けは、差別に重大な影響を及ぼすことなく、ほとんどの環境でキャリブレーションを改善した。
より類似したコホートで開発されたモデルでは、単独手術(Spearman $ρ=0.803$, $p<0.001$)と手術+補助化学療法コホート(Spearman $ρ=0.737$, $p<0.001$)で低ICIを実現し、DCAでより優れた臨床効果を提供した。
関連論文リスト
- Cerebra: A Multidisciplinary AI Board for Multimodal Dementia Characterization and Risk Assessment [56.62016795093786]
CerebraはインタラクティブなマルチエージェントAIチームで、ERH、臨床ノート、医療画像分析のための特殊エージェントをコーディネートする。
構造化された表現を操作することで、プライバシ保護デプロイメントをサポートし、モダリティが不完全であれば、堅牢である。
Cerebraは、有識者のパフォーマンスを著しく改善し、前向き認知症リスク推定において精度を17.5ポイント向上させた。
論文 参考訳(メタデータ) (2026-03-23T05:46:45Z) - Efficient Variance-reduced Estimation from Generative EHR Models: The SCOPE and REACH Estimators [1.0765331200875645]
トークン化された電子健康記録タイムラインを用いてトレーニングした生成モデルは、臨床結果の予測を約束する。
既存のアプローチには、患者のリスクレベルを低く区別するスパース推定分布、極端な計算コスト、サンプリング分散の3つの重要な制限がある。
本稿では,予測条件ハザード(REACH)のSCOPE(Sum of Conditional Outcome Probability Estimator)とリスク推定(Sum of Conditional Probability Estimator)の2つの新しい推定手法を提案する。
論文 参考訳(メタデータ) (2026-02-03T16:49:44Z) - Intersectional Fairness in Vision-Language Models for Medical Image Disease Classification [25.30858592524878]
CMAC-MMD(Cross-Modal Alignment Consistency)は、横断的な患者サブグループ間で診断の確実性を標準化するトレーニングフレームワークである。
皮膚科コホートでは, 交叉異常診断ギャップ(正陽性率差$TPR)を0.50から0.26に減らした。
緑内障検診では、TPRが0.41ドルから0.31ドルに値下げされ、より良いAUCが0.72ドル(vs. 0.71ベースライン)となった。
論文 参考訳(メタデータ) (2025-12-17T09:47:29Z) - Mitigating Calibration Bias Without Fixed Attribute Grouping for
Improved Fairness in Medical Imaging Analysis [2.8943928153775826]
クラスタ・フォーカス (Cluster-Focal) は、まず粗悪な校正されたサンプルを識別し、それらをグループに分類し、その後、校正バイアスを改善するためにグループ指向の焦点損失を導入する。
HAM10000データセットを用いた皮膚病変分類と,多発性硬化症(MS)患者の将来の病変活動の予測について検討した。
論文 参考訳(メタデータ) (2023-07-04T14:14:12Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Bayesian prognostic covariate adjustment [59.75318183140857]
疾患の結果に関する歴史的データは、様々な方法で臨床試験の分析に組み込むことができる。
我々は, 予測モデルからの予後スコアを用いて, 治療効果推定の効率を向上する既存の文献に基づいて構築する。
論文 参考訳(メタデータ) (2020-12-24T05:19:03Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。