論文の概要: Bayesian logistic regression for online recalibration and revision of
risk prediction models with performance guarantees
- arxiv url: http://arxiv.org/abs/2110.06866v1
- Date: Wed, 13 Oct 2021 17:03:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 16:47:08.767981
- Title: Bayesian logistic regression for online recalibration and revision of
risk prediction models with performance guarantees
- Title(参考訳): オンライン校正のためのベイズロジスティック回帰と性能保証付きリスク予測モデルの改訂
- Authors: Jean Feng, Alexej Gossmann, Berkman Sahiner, Romain Pirracchio
- Abstract要約: 本稿では,予測モデルの継続的再校正と修正の2つの手順を紹介する。
シミュレーションを用いて実証評価を行い, COPDリスクを予測する実世界の研究を行った。
我々は「I型とII型」の遺残境界を導出する。これは、手順が静的モデルに非劣等であり、オラクルのロジスティックリバイザと競合することを保証している。
- 参考スコア(独自算出の注目度): 6.709991492637819
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: After deploying a clinical prediction model, subsequently collected data can
be used to fine-tune its predictions and adapt to temporal shifts. Because
model updating carries risks of over-updating/fitting, we study online methods
with performance guarantees. We introduce two procedures for continual
recalibration or revision of an underlying prediction model: Bayesian logistic
regression (BLR) and a Markov variant that explicitly models distribution
shifts (MarBLR). We perform empirical evaluation via simulations and a
real-world study predicting COPD risk. We derive "Type I and II" regret bounds,
which guarantee the procedures are non-inferior to a static model and
competitive with an oracle logistic reviser in terms of the average loss. Both
procedures consistently outperformed the static model and other online logistic
revision methods. In simulations, the average estimated calibration index
(aECI) of the original model was 0.828 (95%CI 0.818-0.938). Online
recalibration using BLR and MarBLR improved the aECI, attaining 0.265 (95%CI
0.230-0.300) and 0.241 (95%CI 0.216-0.266), respectively. When performing more
extensive logistic model revisions, BLR and MarBLR increased the average AUC
(aAUC) from 0.767 (95%CI 0.765-0.769) to 0.800 (95%CI 0.798-0.802) and 0.799
(95%CI 0.797-0.801), respectively, in stationary settings and protected against
substantial model decay. In the COPD study, BLR and MarBLR dynamically combined
the original model with a continually-refitted gradient boosted tree to achieve
aAUCs of 0.924 (95%CI 0.913-0.935) and 0.925 (95%CI 0.914-0.935), compared to
the static model's aAUC of 0.904 (95%CI 0.892-0.916). Despite its simplicity,
BLR is highly competitive with MarBLR. MarBLR outperforms BLR when its prior
better reflects the data. BLR and MarBLR can improve the transportability of
clinical prediction models and maintain their performance over time.
- Abstract(参考訳): 臨床予測モデルをデプロイした後、収集したデータは予測を微調整し、時間シフトに適応するために使用できる。
モデル更新にはオーバーアップ/フィッティングのリスクが伴うため,オンライン手法を性能保証で検討する。
ベイジアンロジスティック回帰 (BLR) とマルコフ変法 (MarBLR) の2つの方法を紹介し, 分布シフト (MarBLR) を明示的にモデル化した。
シミュレーションを用いて実証評価を行い, COPDリスクを予測する実世界の研究を行った。
我々は「I型とII型」の遺残境界を導出する。これは、手順が静的モデルに非劣等であり、平均損失の点でオラクルロジスティックリバイザと競合することを保証している。
どちらの手順も静的モデルや他のオンラインロジスティックリビジョンメソッドを一貫して上回っている。
シミュレーションでは、原モデルの平均キャリブレーション指数(aECI)は0.828(95%CI 0.818-0.938)であった。
BLRとMarBLRによるオンライン再校正により、aECIは0.265 (95%CI 0.230-0.300) と0.241 (95%CI 0.216-0.266) に改善された。
より広範なロジスティックなモデル修正を行うと、BLRとMarBLRは平均的なAUC(aAUC)を0.767(95%CI 0.765-0.769)から0.800(95%CI 0.798-0.802)に引き上げた。
COPD研究において、BLRとMarBLRは、元のモデルと継続的に改良された勾配木を動的に組み合わせて、 0.924 (95%CI 0.913-0.935) と 0.925 (95%CI 0.914-0.935) の aAUC (95%CI 0.992-0.916) を達成した。
その単純さにもかかわらず、BLRはMarBLRと非常に競合している。
marblrは、以前のデータがよりよく反映されるとblrを上回る。
BLRとMarBLRは臨床予測モデルの輸送性を改善し、時間とともにその性能を維持することができる。
関連論文リスト
- Enhancing Retail Sales Forecasting with Optimized Machine Learning Models [0.0]
小売売上高予測では、在庫管理と戦略的計画にとって、将来の売上を正確に予測することが不可欠である。
機械学習(ML)の最近の進歩は、より堅牢な代替手段を提供する。
この研究はML、特にランダムフォレスト(RF)、グラディエントブースティング(GB)、サポートベクター回帰(SVR)、XGBoostの力の恩恵を受けている。
論文 参考訳(メタデータ) (2024-10-17T17:11:33Z) - Test-Time Adaptation Induces Stronger Accuracy and Agreement-on-the-Line [65.14099135546594]
最近のテスト時間適応 (TTA) 法は, モデルに非常に弱い相関関係を示すシフトであっても, ACL と AGL の傾向を大幅に強化する。
この結果から,TTAとAGLに基づく推定手法を組み合わせることで,より広い分布シフトの集合に対する高精度なモデルOOD性能を推定できることが示唆された。
論文 参考訳(メタデータ) (2023-10-07T23:21:25Z) - Guided Diffusion Model for Adversarial Purification from Random Noise [0.0]
本稿では,敵攻撃に対する強力な防御策として,新しい拡散浄化法を提案する。
我々のモデルは、CIFAR-10データセット上でPGD-L_inf攻撃(eps = 8/255)の下で、89.62%の堅牢な精度を達成する。
論文 参考訳(メタデータ) (2022-06-22T06:55:03Z) - Posterior Coreset Construction with Kernelized Stein Discrepancy for
Model-Based Reinforcement Learning [78.30395044401321]
我々は、強化学習(MBRL)のための新しいモデルベースアプローチを開発する。
ターゲット遷移モデルの仮定を緩和し、混合モデルの一般的な族に属する。
連続的な制御環境では、壁時計の時間を最大50%削減することができる。
論文 参考訳(メタデータ) (2022-06-02T17:27:49Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - An Interpretable Web-based Glioblastoma Multiforme Prognosis Prediction
Tool using Random Forest Model [1.1024591739346292]
治療後1年間のGBM患者の健康状態を推定する予測モデルを提案する。
総計467名のGBM患者の臨床像を13の特徴と2つの経過日で比較検討した。
GBM患者生存の予後因子のトップ3はMGMT遺伝子プロモーター,切除範囲,年齢であった。
論文 参考訳(メタデータ) (2021-08-30T07:56:34Z) - Residual Energy-Based Models for End-to-End Speech Recognition [26.852537542649866]
自己回帰型ASRモデルを補完するために残留エネルギーベースモデル(R-EBM)を提案する。
100hr LibriSpeechデータセットの実験では、R-EBMはワードエラー率(WER)を8.2%/6.7%削減できる。
自己教師付き学習(wav2vec 2.0)を用いた最先端モデルでは、R-EBMはWERと信頼性推定性能の両方を大幅に改善する。
論文 参考訳(メタデータ) (2021-03-25T22:08:00Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - Learnable Boundary Guided Adversarial Training [66.57846365425598]
私たちは、あるクリーンモデルからのモデルロジットを使用して、別のロバストモデルの学習をガイドします。
我々は、CIFAR-100上で、追加の実データや合成データなしで、新しい最先端のロバスト性を実現する。
論文 参考訳(メタデータ) (2020-11-23T01:36:05Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Short-term forecasting COVID-19 cumulative confirmed cases: Perspectives
for Brazil [3.0711362702464675]
新型コロナウイルス(COVID-19)は、今日までの最初の通知以来、何百万人もの人に感染する新興の病気だ。
本稿では、自己回帰統合移動平均(ARIMA)、キュビスト(CUBIST)、ランダムフォレスト(RF)、リッジ回帰(RIDGE)、スタックングアンサンブル学習を評価する。
開発されたモデルは正確な予測を生成でき、それぞれ0.87%から3.51%、1.02%から5.63%、0.95%から6.90%の誤差を発生させる。
論文 参考訳(メタデータ) (2020-07-21T17:58:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。