論文の概要: Deep Stable Representation Learning on Electronic Health Records
- arxiv url: http://arxiv.org/abs/2209.01321v1
- Date: Sat, 3 Sep 2022 04:10:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 15:20:45.034635
- Title: Deep Stable Representation Learning on Electronic Health Records
- Title(参考訳): 電子健康記録に基づく深層安定表現学習
- Authors: Yingtao Luo, Zhaocheng Liu and Qiang Liu
- Abstract要約: CHE(Causal Healthcare Embedding)は、診断と処置の依存関係を取り除くことで、突発的な統計的関係を取り除くことを目的としている。
提案手法は,既存の深層学習モデルをEHR上で拡張可能な,フレキシブルなプラグアンドプレイモジュールとして利用できる。
- 参考スコア(独自算出の注目度): 8.256340233221112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning models have achieved promising disease prediction performance
of the Electronic Health Records (EHR) of patients. However, most models
developed under the I.I.D. hypothesis fail to consider the agnostic
distribution shifts, diminishing the generalization ability of deep learning
models to Out-Of-Distribution (OOD) data. In this setting, spurious statistical
correlations that may change in different environments will be exploited, which
can cause sub-optimal performances of deep learning models. The unstable
correlation between procedures and diagnoses existed in the training
distribution can cause spurious correlation between historical EHR and future
diagnosis. To address this problem, we propose to use a causal representation
learning method called Causal Healthcare Embedding (CHE). CHE aims at
eliminating the spurious statistical relationship by removing the dependencies
between diagnoses and procedures. We introduce the Hilbert-Schmidt Independence
Criterion (HSIC) to measure the degree of independence between the embedded
diagnosis and procedure features. Based on causal view analyses, we perform the
sample weighting technique to get rid of such spurious relationship for the
stable learning of EHR across different environments. Moreover, our proposed
CHE method can be used as a flexible plug-and-play module that can enhance
existing deep learning models on EHR. Extensive experiments on two public
datasets and five state-of-the-art baselines unequivocally show that CHE can
improve the prediction accuracy of deep learning models on out-of-distribution
data by a large margin. In addition, the interpretability study shows that CHE
could successfully leverage causal structures to reflect a more reasonable
contribution of historical records for predictions.
- Abstract(参考訳): 深層学習モデルは患者の電子健康記録(EHR)の有望な疾患予測性能を達成した。
しかし、I.I.D.仮説の下で開発されたほとんどのモデルは、非依存的な分布シフトを考慮せず、ディープラーニングモデルの一般化能力をOF-Distribution(OOD)データに還元する。
この設定では、異なる環境で変化する可能性のある急激な統計的相関が利用され、深層学習モデルの準最適性能を引き起こす可能性がある。
トレーニング分布における術式と診断の不安定な相関は,過去のERHと今後の診断との間に急激な相関をもたらす可能性がある。
この問題に対処するために、我々はCausal Healthcare Embedding (CHE)と呼ばれる因果表現学習手法を提案する。
CHEは、診断と手順の依存関係を取り除くことで、突発的な統計的関係を取り除くことを目的としている。
我々はHilbert-Schmidt Independence Criterion (HSIC)を導入し, 組込み診断と術式特徴の独立度を測定した。
因果的視点分析に基づき,異なる環境における安定したEHR学習のために,このような急激な関係を取り除くために,サンプル重み付け手法を実行する。
さらに,提案手法は,既存のEHR深層学習モデルを拡張可能な,フレキシブルなプラグアンドプレイモジュールとして利用することができる。
2つの公開データセットと5つの最先端ベースラインに関する広範囲な実験は、cheが分散データのディープラーニングモデルの予測精度を大きなマージンで向上できることを明確に示している。
さらに、解釈可能性の研究は、CHEが因果構造をうまく活用し、予測のための歴史的記録のより合理的な貢献を反映できることを示している。
関連論文リスト
- Considerations for Distribution Shift Robustness of Diagnostic Models in Healthcare [10.393967785465536]
健康のための応用MLの分野では、患者に関する情報を考慮せずに$X$から$Y$を予測することが一般的である。
本研究では,医療環境に共通するデータ生成機構を強調し,因果関係の文献による最近の理論的結果を用いて,堅牢な予測モデルを構築する方法について論じる。
論文 参考訳(メタデータ) (2024-10-25T14:13:09Z) - Towards Interpretable End-Stage Renal Disease (ESRD) Prediction: Utilizing Administrative Claims Data with Explainable AI Techniques [6.417777780911223]
本研究は,慢性腎臓病(CKD)から末期腎疾患(ESRD)への進行を予測するために,高度な機械学習とディープラーニング技術を組み合わせた管理クレームデータを活用する可能性を検討する。
我々は、ランダムフォレストやXGBoostといった従来の機械学習手法とLong Short-Term Memory(LSTM)ネットワークのようなディープラーニングアプローチを用いて、大手医療保険会社が提供した包括的10年間のデータセットを分析し、複数の観測窓の予測モデルを開発する。
以上の結果から,LSTMモデル,特に24ヶ月の観測窓を用いた場合,ESRD進行予測において優れた性能を示した。
論文 参考訳(メタデータ) (2024-09-18T16:03:57Z) - Deep State-Space Generative Model For Correlated Time-to-Event Predictions [54.3637600983898]
そこで本研究では,様々な種類の臨床イベント間の相互作用を捉えるために,潜伏状態空間生成モデルを提案する。
また,死亡率と臓器不全の関連性について有意な知見が得られた。
論文 参考訳(メタデータ) (2024-07-28T02:42:36Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Learnable Prompt as Pseudo-Imputation: Reassessing the Necessity of
Traditional EHR Data Imputation in Downstream Clinical Prediction [16.638760651750744]
既存のディープラーニングトレーニングプロトコルでは、欠落した値を再構築するために統計情報や計算モデルを使用する必要がある。
本稿では,Pseudo Imputation (PAI) を新たなトレーニングプロトコルとして紹介する。
PAIはもはやインプットデータを導入しないが、ダウンストリームモデルの暗黙の選好を欠落値にモデル化するための学習可能なプロンプトを構築する。
論文 参考訳(メタデータ) (2024-01-30T07:19:36Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Bidirectional Representation Learning from Transformers using Multimodal
Electronic Health Record Data to Predict Depression [11.1492931066686]
うつ病の予測のために,ERHシーケンス上で双方向の表現学習を行うための時間的深層学習モデルを提案する。
このモデルでは, 曲線(PRAUC)下において, 最良ベースラインモデルと比較して, 抑うつ予測において0.70から0.76まで, 精度・リコール面積の最大値が得られた。
論文 参考訳(メタデータ) (2020-09-26T17:56:37Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。