論文の概要: Contrastive Learning Improves Critical Event Prediction in COVID-19
Patients
- arxiv url: http://arxiv.org/abs/2101.04013v1
- Date: Mon, 11 Jan 2021 16:41:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 14:35:45.372004
- Title: Contrastive Learning Improves Critical Event Prediction in COVID-19
Patients
- Title(参考訳): コントラスト学習は新型コロナウイルス患者の臨界事象予測を改善する
- Authors: Tingyi Wanyan, Hossein Honarvar, Suraj K. Jaladanki, Chengxi Zang,
Nidhi Naik, Sulaiman Somani, Jessica K. De Freitas, Ishan Paranjpe, Akhil
Vaid, Riccardo Miotto, Girish N. Nadkarni, Marinka Zitnik, ArifulAzad, Fei
Wang, Ying Ding, Benjamin S. Glicksberg
- Abstract要約: 対照的損失 (CL) は非平衡 EHR データに対するクロスエントロピー損失 (CEL) の性能を改善することを示した。
この研究は、シナイ山にあるIcahn School of MedicineのInstitutional Review Boardによって承認されています。
- 参考スコア(独自算出の注目度): 19.419685256069666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine Learning (ML) models typically require large-scale, balanced training
data to be robust, generalizable, and effective in the context of healthcare.
This has been a major issue for developing ML models for the
coronavirus-disease 2019 (COVID-19) pandemic where data is highly imbalanced,
particularly within electronic health records (EHR) research. Conventional
approaches in ML use cross-entropy loss (CEL) that often suffers from poor
margin classification. For the first time, we show that contrastive loss (CL)
improves the performance of CEL especially for imbalanced EHR data and the
related COVID-19 analyses. This study has been approved by the Institutional
Review Board at the Icahn School of Medicine at Mount Sinai. We use EHR data
from five hospitals within the Mount Sinai Health System (MSHS) to predict
mortality, intubation, and intensive care unit (ICU) transfer in hospitalized
COVID-19 patients over 24 and 48 hour time windows. We train two sequential
architectures (RNN and RETAIN) using two loss functions (CEL and CL). Models
are tested on full sample data set which contain all available data and
restricted data set to emulate higher class imbalance.CL models consistently
outperform CEL models with the restricted data set on these tasks with
differences ranging from 0.04 to 0.15 for AUPRC and 0.05 to 0.1 for AUROC. For
the restricted sample, only the CL model maintains proper clustering and is
able to identify important features, such as pulse oximetry. CL outperforms CEL
in instances of severe class imbalance, on three EHR outcomes with respect to
three performance metrics: predictive power, clustering, and feature
importance. We believe that the developed CL framework can be expanded and used
for EHR ML work in general.
- Abstract(参考訳): マシンラーニング(ML)モデルは一般的に、医療のコンテキストにおいて堅牢で一般化可能で効果的な、大規模でバランスのとれたトレーニングデータを必要とする。
これは、特に電子健康記録(EHR)調査において、データを高度に不均衡にしている新型コロナウイルス(COVID-19)パンデミックのためのMLモデルを開発する上で、大きな問題となっている。
MLの従来のアプローチでは、しばしば粗利分類に苦しむクロスエントロピー損失(CEL)を用いる。
比較損失(CL)は,特に不均衡なEHRデータと関連するCOVID-19分析において,CELの性能を向上させることが初めて示された。
この研究は、シナイ山にあるイカーン医学学校(Icahn School of Medicine)の機関審査委員会(Institutional Review Board)によって承認された。
入院後24時間,48時間以上で死亡率,挿管量,集中治療単位(ICU)の移動を予測するために,マウント・シナイ・ヘルス・システム(MSHS)内の5病院のEHRデータを用いた。
我々は2つの損失関数 (CEL と CL) を用いて2つの連続アーキテクチャ (RNN と RETAIN) を訓練する。
モデルはすべての利用可能なデータと制限付きデータセットを含む完全なサンプルデータセット上でテストされ、auprcでは0.04から0.15、aurocでは0.05から0.1と、これらのタスクで設定された制限付きデータと一貫してcelモデルを上回る。
制限されたサンプルでは、clモデルのみが適切なクラスタリングを維持し、パルスオキシメトリのような重要な特徴を識別できる。
CLは、予測力、クラスタリング、機能の重要性の3つのパフォーマンス指標に関して、3つのEHR結果に対して、厳しいクラス不均衡のケースでCELを上回っます。
開発したCLフレームワークは拡張可能であり、一般に EHR ML の作業に使用できると信じている。
関連論文リスト
- Enhancing Glucose Level Prediction of ICU Patients through Irregular Time-Series Analysis and Integrated Representation [4.101915841246237]
我々は,次のレベルを予測するための新しい学習モデルを開発し,低血糖,高血糖,高血糖に分類した。
本研究はICU患者における血糖値の予測に焦点をあてるが、MITSTは他の重要な事象予測タスクにも容易に拡張できる。
論文 参考訳(メタデータ) (2024-11-03T03:03:11Z) - FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - CEL: A Continual Learning Model for Disease Outbreak Prediction by
Leveraging Domain Adaptation via Elastic Weight Consolidation [4.693707128262634]
本研究では,EWC(Elastic Weight Consolidation)による領域適応を利用した連続学習のための新しいCELモデルを提案する。
CELの堅牢性と信頼性は、既存のベンチマーク研究と比較して65%の忘れ込み率と18%のメモリ安定性で裏付けられている。
論文 参考訳(メタデータ) (2024-01-17T03:26:04Z) - Evaluating the Fairness of the MIMIC-IV Dataset and a Baseline
Algorithm: Application to the ICU Length of Stay Prediction [65.268245109828]
本稿では、MIMIC-IVデータセットを用いて、滞在時間を予測するXGBoostバイナリ分類モデルにおける公平性とバイアスについて検討する。
この研究は、人口統計属性にわたるデータセットのクラス不均衡を明らかにし、データ前処理と特徴抽出を採用する。
この論文は、偏見を緩和するための公正な機械学習技術と、医療専門家とデータサイエンティストの協力的な努力の必要性について結論付けている。
論文 参考訳(メタデータ) (2023-12-31T16:01:48Z) - Mixed-Integer Projections for Automated Data Correction of EMRs Improve
Predictions of Sepsis among Hospitalized Patients [7.639610349097473]
本稿では,領域制約として臨床専門知識をシームレスに統合する革新的プロジェクションに基づく手法を提案する。
我々は、患者データの健全な範囲を規定する制約から補正されたデータの距離を測定する。
AUROCは0.865で、精度は0.922で、従来のMLモデルを上回る。
論文 参考訳(メタデータ) (2023-08-21T15:14:49Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Density-Aware Personalized Training for Risk Prediction in Imbalanced
Medical Data [89.79617468457393]
不均衡率(クラス密度差)のトレーニングモデルは、最適以下の予測につながる可能性がある。
この不均衡問題に対するモデルトレーニングのためのフレームワークを提案する。
実世界の医療データセットにおけるモデルの性能向上を実証する。
論文 参考訳(メタデータ) (2022-07-23T00:39:53Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Predicting Hyperkalemia in the ICU and Evaluation of Generalizability
and Interpretability [5.9854349801427285]
高カルシウム血症は致命的な不整脈を引き起こす危険がある。
集中治療室(ICU)患者を高カルシウム血症のリスクで同定する予測モデルを開発した。
i) 0.79, 0.81, 0.81 および (ii) 0.81, 0.85, 0.85 の AUC を用いて, LR, RF, XGBoost をそれぞれ予測した。
論文 参考訳(メタデータ) (2021-01-16T12:35:27Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。