論文の概要: Surrogate Assisted Semi-supervised Inference for High Dimensional Risk
Prediction
- arxiv url: http://arxiv.org/abs/2105.01264v1
- Date: Tue, 4 May 2021 03:08:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 12:47:15.319864
- Title: Surrogate Assisted Semi-supervised Inference for High Dimensional Risk
Prediction
- Title(参考訳): 高次元リスク予測のためのサロゲート支援半教師付き推論
- Authors: Jue Hou, Zijian Guo and Tianxi Cai
- Abstract要約: 高次元予測器を用いたリスクモデリングのためのSAS(Surrogate Assisted Semi-supervised- Learning)アプローチを開発しています。
SAS法が高次元作業モデルに起因する予測リスクに対して有効な推論を提供することを実証する。
- 参考スコア(独自算出の注目度): 3.10560974227074
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Risk modeling with EHR data is challenging due to a lack of direct
observations on the disease outcome, and the high dimensionality of the
candidate predictors. In this paper, we develop a surrogate assisted
semi-supervised-learning (SAS) approach to risk modeling with high dimensional
predictors, leveraging a large unlabeled data on candidate predictors and
surrogates of outcome, as well as a small labeled data with annotated outcomes.
The SAS procedure borrows information from surrogates along with candidate
predictors to impute the unobserved outcomes via a sparse working imputation
model with moment conditions to achieve robustness against mis-specification in
the imputation model and a one-step bias correction to enable interval
estimation for the predicted risk. We demonstrate that the SAS procedure
provides valid inference for the predicted risk derived from a high dimensional
working model, even when the underlying risk prediction model is dense and the
risk model is mis-specified. We present an extensive simulation study to
demonstrate the superiority of our SSL approach compared to existing supervised
methods. We apply the method to derive genetic risk prediction of type-2
diabetes mellitus using a EHR biobank cohort.
- Abstract(参考訳): EHRデータを用いたリスクモデリングは、疾患結果の直接的観察の欠如と、候補予測器の高次元性のために困難である。
本稿では,高次元予測器を用いたリスクモデリングのためのサロゲート支援半教師付き学習(SAS)アプローチを開発し,候補予測器の非ラベルデータと結果のサロゲートデータと,アノテートされた結果を持つ小さなラベル付きデータを利用する。
SASプロシージャは、サロゲートと候補予測器から情報を借りて、モーメント条件のスパース作業計算モデルを介して未観測結果をインプットし、インプットモデルにおける誤特定に対する堅牢性及び1ステップの偏差補正を実現し、予測リスクの間隔推定を可能にする。
本手法は,リスク予測モデルが密集し,リスクモデルが不特定化されている場合でも,高次元作業モデルから得られる予測リスクの正当な推論を提供する。
本稿では,既存の教師付き手法と比較してSSLアプローチの優位性を示すため,広範囲なシミュレーション研究を行う。
EHRバイオバンクコホートを用いた2型糖尿病の遺伝的リスク予測に本手法を適用した。
関連論文リスト
- Data-driven decision-making under uncertainty with entropic risk measure [5.407319151576265]
エントロピーリスク尺度は、不確実な損失に関連する尾のリスクを考慮に入れた高い意思決定に広く用いられている。
経験的エントロピーリスク推定器を劣化させるため, 強く一貫したブートストラップ手法を提案する。
検証性能のバイアスが補正されない場合,クロスバリデーション手法は,保険業者のアウト・オブ・サンプルリスクを著しく高める可能性があることを示す。
論文 参考訳(メタデータ) (2024-09-30T04:02:52Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Boosting the interpretability of clinical risk scores with intervention
predictions [59.22442473992704]
本稿では、今後の介入に関するモデルの仮定を明確に伝達する手段として、介入政策と有害事象リスクの合同モデルを提案する。
死亡確率などの典型的なリスクスコアと将来の介入確率スコアとを組み合わせることで、より解釈可能な臨床予測がもたらされることを示す。
論文 参考訳(メタデータ) (2022-07-06T19:49:42Z) - Mitigating multiple descents: A model-agnostic framework for risk
monotonization [84.6382406922369]
クロスバリデーションに基づくリスクモノトナイズのための一般的なフレームワークを開発する。
本稿では,データ駆動方式であるゼロステップとワンステップの2つの手法を提案する。
論文 参考訳(メタデータ) (2022-05-25T17:41:40Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - A New Approach for Interpretability and Reliability in Clinical Risk
Prediction: Acute Coronary Syndrome Scenario [0.33927193323747895]
我々は、リスクスコアと機械学習モデルの両方の最高の特徴を組み合わせた、新たなリスクアセスメント方法論を作成するつもりです。
提案手法は、標準LRと同一の試験結果を得たが、より優れた解釈性とパーソナライゼーションを提供する。
個人予測の信頼性推定は誤分類率と大きな相関を示した。
論文 参考訳(メタデータ) (2021-10-15T19:33:46Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Efficient Estimation and Evaluation of Prediction Rules in
Semi-Supervised Settings under Stratified Sampling [6.930951733450623]
本稿では,2段階の半教師付き学習(SSL)手法を提案する。
ステップIでは、非ランダムサンプリングを考慮した非線形基底関数による重み付き回帰により、欠落ラベルをインプットする。
ステップIIでは、結果の予測器の整合性を確保するために、初期計算を増強する。
論文 参考訳(メタデータ) (2020-10-19T12:54:45Z) - Learning to Predict Error for MRI Reconstruction [67.76632988696943]
提案手法による予測の不確実性は予測誤差と強く相関しないことを示す。
本稿では,2段階の予測誤差の目標ラベルと大小を推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-02-13T15:55:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。