論文の概要: PRISM: Leveraging Prototype Patient Representations with
Feature-Missing-Aware Calibration for EHR Data Sparsity Mitigation
- arxiv url: http://arxiv.org/abs/2309.04160v3
- Date: Thu, 25 Jan 2024 17:14:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 18:03:17.924014
- Title: PRISM: Leveraging Prototype Patient Representations with
Feature-Missing-Aware Calibration for EHR Data Sparsity Mitigation
- Title(参考訳): PRISM: EHRデータスカラー化のための特徴ミス対応校正による患者表現の活用
- Authors: Yinghao Zhu, Zixiang Wang, Long He, Shiyun Xie, Liantao Ma, Chengwei
Pan
- Abstract要約: PRISMは、類似した患者のプロトタイプ表現を通じて間接的にデータを伝達する新しい計算法である。
PRISMはさらに機能信頼モジュールで革新し、欠落したデータから各機能の信頼性を評価する。
MIMIC-IIIおよびMIMIC-IVデータセットを用いた実験は、PRISMが院内死亡率と30日間の読解タスクを予測する上で優れた性能を示した。
- 参考スコア(独自算出の注目度): 7.873181587802631
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electronic Health Record (EHR) data, while rich in information, often suffers
from sparsity, posing significant challenges in predictive modeling.
Traditional imputation methods inadequately distinguish between real and
imputed data, leading to potential inaccuracies in models. Addressing this, we
introduce PRISM, a novel approach that indirectly imputes data through
prototype representations of similar patients, thus ensuring denser and more
accurate embeddings. PRISM innovates further with a feature confidence learner
module, which evaluates the reliability of each feature in light of missing
data. Additionally, it incorporates a novel patient similarity metric that
accounts for feature confidence, avoiding overreliance on imprecise imputed
values. Our extensive experiments on the MIMIC-III and MIMIC-IV datasets
demonstrate PRISM's superior performance in predicting in-hospital mortality
and 30-day readmission tasks, showcasing its effectiveness in handling EHR data
sparsity. For the sake of reproducibility and further research, we have made
the code publicly available at https://github.com/yhzhu99/PRISM.
- Abstract(参考訳): EHR(Electronic Health Record)のデータは情報に富んでいるが、しばしばスパーシティに悩まされ、予測モデリングにおいて重大な課題を提起する。
従来の命令法は、実データと偽データとを不適切に区別し、モデルに潜在的な不正確性をもたらす。
PRISMは、類似した患者のプロトタイプ表現を通じてデータを間接的にインプットし、より密で正確な埋め込みを保証する新しい手法である。
PRISMはさらに機能信頼学習モジュールで革新し、欠落したデータに照らして各機能の信頼性を評価する。
さらに、不正確なインプット値に対する過度な信頼を避けるため、特徴的信頼を考慮に入れた新しい患者類似度指標も組み込まれている。
我々のMIMIC-IIIとMIMIC-IVデータセットに関する広範な実験は、PRISMが宿主死亡率と30日間の読解タスクを予測する上で優れた性能を示し、EHRデータ空間の扱いの有効性を示している。
再現性とさらなる研究のために、コードをhttps://github.com/yhzhu99/PRISM.comで公開しました。
関連論文リスト
- Learnable Prompt as Pseudo-Imputation: Reassessing the Necessity of
Traditional EHR Data Imputation in Downstream Clinical Prediction [16.638760651750744]
既存のディープラーニングトレーニングプロトコルでは、欠落した値を再構築するために統計情報や計算モデルを使用する必要がある。
本稿では,Pseudo Imputation (PAI) を新たなトレーニングプロトコルとして紹介する。
PAIはもはやインプットデータを導入しないが、ダウンストリームモデルの暗黙の選好を欠落値にモデル化するための学習可能なプロンプトを構築する。
論文 参考訳(メタデータ) (2024-01-30T07:19:36Z) - IGNITE: Individualized GeNeration of Imputations in Time-series
Electronic health records [7.451873794596469]
本研究では、患者動態を学習し、個人の人口動態の特徴や治療に合わせたパーソナライズされた値を生成する新しいディープラーニングモデルを提案する。
提案モデルであるIGNITEは,2段階の注意を付加した条件付き2変分オートエンコーダを用いて,個人に対して欠落した値を生成する。
IGNITEは,データ再構成の欠如やタスク予測において,最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-01-09T07:57:21Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Conservative Prediction via Data-Driven Confidence Minimization [66.35245313125934]
機械学習モデルのエラーは、特に医療のような安全クリティカルな領域では、コストがかかる。
本稿では、不確実性データセットに対する信頼性を最小化するデータ駆動型信頼性最小化(DCM)を提案する。
実験の結果、DCMは8つのID-OODデータセットペアに対して、最先端のOOD検出方法よりも一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Reliable and Trustworthy Machine Learning for Health Using Dataset Shift
Detection [7.263558963357268]
予測不能なMLモデルの振る舞いは、特に健康領域において、その安全性に対する深刻な懸念を引き起こす。
マハラノビス距離およびグラム行列に基づく分布外検出法は,分布外データを高精度に検出できることを示す。
次に、アウト・オブ・ディストリビューションスコアを人間の解釈可能なConFIDENCE SCOREに変換し、ユーザーの健康MLアプリケーションとのインタラクションに与える影響を調査する。
論文 参考訳(メタデータ) (2021-10-26T20:49:01Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Uncertainty-Gated Stochastic Sequential Model for EHR Mortality
Prediction [6.170898159041278]
本稿では,欠落変数の分布を推定し,隠れ状態の更新を行い,院内死亡の可能性を予測できる新しい変動再帰ネットワークを提案する。
我々のモデルは、これらの手順を1つのストリームで実行し、エンドツーエンドで全てのネットワークパラメータを共同で学習できることは注目に値する。
論文 参考訳(メタデータ) (2020-03-02T04:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。