論文の概要: A comparison of approaches to improve worst-case predictive model
performance over patient subpopulations
- arxiv url: http://arxiv.org/abs/2108.12250v1
- Date: Fri, 27 Aug 2021 13:10:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-30 14:20:30.126336
- Title: A comparison of approaches to improve worst-case predictive model
performance over patient subpopulations
- Title(参考訳): 患者サブポピュレーションにおける最悪の予測モデル性能向上手法の比較
- Authors: Stephen R. Pfohl, Haoran Zhang, Yizhe Xu, Agata Foryciarz, Marzyeh
Ghassemi, Nigam H. Shah
- Abstract要約: 患者において平均的に正確な臨床結果の予測モデルは、いくつかのサブ集団に対して劇的に過小評価される可能性がある。
サブポピュレーションに対する解離および最悪の性能を一貫して改善するモデル開発と選択のアプローチを同定する。
本研究は, 比較的少数の例外を除いて, 標準学習法よりも, 患者サブポピュレーションに対するアプローチが優れていることが確認された。
- 参考スコア(独自算出の注目度): 14.175321968797252
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predictive models for clinical outcomes that are accurate on average in a
patient population may underperform drastically for some subpopulations,
potentially introducing or reinforcing inequities in care access and quality.
Model training approaches that aim to maximize worst-case model performance
across subpopulations, such as distributionally robust optimization (DRO),
attempt to address this problem without introducing additional harms. We
conduct a large-scale empirical study of DRO and several variations of standard
learning procedures to identify approaches for model development and selection
that consistently improve disaggregated and worst-case performance over
subpopulations compared to standard approaches for learning predictive models
from electronic health records data. In the course of our evaluation, we
introduce an extension to DRO approaches that allows for specification of the
metric used to assess worst-case performance. We conduct the analysis for
models that predict in-hospital mortality, prolonged length of stay, and 30-day
readmission for inpatient admissions, and predict in-hospital mortality using
intensive care data. We find that, with relatively few exceptions, no approach
performs better, for each patient subpopulation examined, than standard
learning procedures using the entire training dataset. These results imply that
when it is of interest to improve model performance for patient subpopulations
beyond what can be achieved with standard practices, it may be necessary to do
so via techniques that implicitly or explicitly increase the effective sample
size.
- Abstract(参考訳): 患者集団の平均で正確である臨床結果の予測モデルは、一部の亜集団では大幅に低下し、医療アクセスと品質の不平等を誘発または強化する可能性がある。
分散ロバスト最適化 (DRO) のようなサブポピュレーション全体の最悪のモデル性能を最大化することを目的としたモデルトレーニング手法は、追加の害を加えることなくこの問題に対処しようとする。
電子健康記録データから予測モデルを学ぶための標準アプローチと比較し,分散化と最悪ケースのパフォーマンスを一貫して向上させるモデル開発と選択のアプローチを特定するため,droの大規模実証研究と標準学習手順のバリエーションについて検討した。
評価の過程では,DROアプローチの拡張を導入し,最悪の場合のパフォーマンスを評価するために使用されるメトリクスの仕様化を可能にした。
本研究は病院内死亡率,滞在期間,入院30日間の入院率を予測したモデルの解析を行い,集中治療データを用いて病院内死亡率を予測した。
比較的少数の例外を除いて、トレーニングデータセット全体を用いた標準的な学習手順よりも、検査された各患者サブポピュレーションに対して、アプローチは改善しないことがわかった。
これらの結果から, 患者サブポピュレーションのモデル性能を, 標準プラクティスで達成できる範囲を超えて向上させるためには, 有効試料サイズを暗黙的に, 明示的に増加させる技術を用いて行う必要がある可能性が示唆された。
関連論文リスト
- Comparison of deep learning and conventional methods for disease onset prediction [7.477956812298417]
深層学習法は臨床データから複雑なパターンを抽出することにより予測性能の向上を約束する。
本研究は, 肺がん, 認知症, 双極性障害を予測するための従来の学習手法と深層学習法を比較した。
論文 参考訳(メタデータ) (2024-10-14T13:46:59Z) - Learnable Prompt as Pseudo-Imputation: Reassessing the Necessity of
Traditional EHR Data Imputation in Downstream Clinical Prediction [16.638760651750744]
既存のディープラーニングトレーニングプロトコルでは、欠落した値を再構築するために統計情報や計算モデルを使用する必要がある。
本稿では,Pseudo Imputation (PAI) を新たなトレーニングプロトコルとして紹介する。
PAIはもはやインプットデータを導入しないが、ダウンストリームモデルの暗黙の選好を欠落値にモデル化するための学習可能なプロンプトを構築する。
論文 参考訳(メタデータ) (2024-01-30T07:19:36Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Looking for Out-of-Distribution Environments in Critical Care: A case
study with the eICU Database [4.915029686150194]
機械学習における新しい人口と領域への一般化は、近年関心が高まっているオープンな問題である。
近年提案されている領域一般化モデルでは,環境間の不変特性を学習することでこの問題を軽減することが期待されている。
批判的ケアにおけるクロスホスピタルなパフォーマンスの一般化の問題に動機づけられた配電環境の特定に基本的アプローチを採る。
論文 参考訳(メタデータ) (2022-05-26T14:46:13Z) - Bridging the Gap Between Patient-specific and Patient-independent
Seizure Prediction via Knowledge Distillation [7.2666838978096875]
既存のアプローチは通常、てんかんの信号の高度にパーソナライズされた特性のために、患者固有の方法でモデルを訓練する。
患者固有のモデルは、蒸留された知識と追加のパーソナライズされたデータによって得られる。
提案手法を用いて,CHB-MIT sEEGデータベース上で5つの最先端の発作予測法を訓練する。
論文 参考訳(メタデータ) (2022-02-25T10:30:29Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Efficient Estimation and Evaluation of Prediction Rules in
Semi-Supervised Settings under Stratified Sampling [6.930951733450623]
本稿では,2段階の半教師付き学習(SSL)手法を提案する。
ステップIでは、非ランダムサンプリングを考慮した非線形基底関数による重み付き回帰により、欠落ラベルをインプットする。
ステップIIでは、結果の予測器の整合性を確保するために、初期計算を増強する。
論文 参考訳(メタデータ) (2020-10-19T12:54:45Z) - Improving Maximum Likelihood Training for Text Generation with Density
Ratio Estimation [51.091890311312085]
本稿では,テキスト生成で遭遇する大規模なサンプル空間において,効率よく安定な自動回帰シーケンス生成モデルのトレーニング手法を提案する。
本手法は,品質と多様性の両面で,最大類似度推定や他の最先端シーケンス生成モデルよりも安定に優れている。
論文 参考訳(メタデータ) (2020-07-12T15:31:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。