論文の概要: Handling Non-ignorably Missing Features in Electronic Health Records
Data Using Importance-Weighted Autoencoders
- arxiv url: http://arxiv.org/abs/2101.07357v2
- Date: Fri, 5 Feb 2021 20:05:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-27 06:38:42.780785
- Title: Handling Non-ignorably Missing Features in Electronic Health Records
Data Using Importance-Weighted Autoencoders
- Title(参考訳): 重要度重み付きオートエンコーダを用いた電子健康記録データの非無視特徴処理
- Authors: David K. Lim, Naim U. Rashid, Junier B. Oliva, Joseph G. Ibrahim
- Abstract要約: 本稿では,生体データのランダムなパターンではなく,欠落を柔軟に扱うために,重要度重み付きオートエンコーダ(iwaes)と呼ばれるvaesの新たな拡張を提案する。
提案手法は,組み込みニューラルネットワークを用いて欠落機構をモデル化し,欠落機構の正確な形式を事前に指定する必要をなくした。
- 参考スコア(独自算出の注目度): 8.518166245293703
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electronic Health Records (EHRs) are commonly used to investigate
relationships between patient health information and outcomes. Deep learning
methods are emerging as powerful tools to learn such relationships, given the
characteristic high dimension and large sample size of EHR datasets. The
Physionet 2012 Challenge involves an EHR dataset pertaining to 12,000 ICU
patients, where researchers investigated the relationships between clinical
measurements, and in-hospital mortality. However, the prevalence and complexity
of missing data in the Physionet data present significant challenges for the
application of deep learning methods, such as Variational Autoencoders (VAEs).
Although a rich literature exists regarding the treatment of missing data in
traditional statistical models, it is unclear how this extends to deep learning
architectures. To address these issues, we propose a novel extension of VAEs
called Importance-Weighted Autoencoders (IWAEs) to flexibly handle Missing Not
At Random (MNAR) patterns in the Physionet data. Our proposed method models the
missingness mechanism using an embedded neural network, eliminating the need to
specify the exact form of the missingness mechanism a priori. We show that the
use of our method leads to more realistic imputed values relative to the
state-of-the-art, as well as significant differences in fitted downstream
models for mortality.
- Abstract(参考訳): 電子健康記録(ehrs)は、患者の健康情報と結果の関係を調べるために一般的に用いられる。
EHRデータセットの特徴的高次元と大きなサンプルサイズを考慮すると、深層学習はそのような関係を学習するための強力なツールとして現れている。
physionet 2012 Challengeには、12,000 ICU患者に関するEHRデータセットが含まれており、臨床測定値と院内死亡率の関係を調査している。
しかし、物理データにおけるデータ欠落の頻度と複雑さは、変分オートエンコーダ(vaes)のような深層学習法の適用において重大な課題を呈している。
従来の統計モデルでは欠落したデータの扱いについては豊富な文献があるが、どのようにしてディープラーニングアーキテクチャに拡張されるのかは不明である。
これらの問題に対処するため、我々はIWAE(Importance-Weighted Autoencoders)と呼ばれる新しいVAEの拡張を提案し、Physoronetデータにおけるミス・ノー・アット・ランダム(MNAR)パターンを柔軟に処理する。
提案手法は,組み込みニューラルネットワークを用いて欠落機構をモデル化し,欠落機構の正確な形式を事前に指定する必要をなくした。
以上の結果から, 本手法を用いることで, 現状と比べ, より現実的な実測値が得られ, 下流モデルによる死亡率の有意差が認められた。
関連論文リスト
- Fine-tuning -- a Transfer Learning approach [0.22344294014777952]
電子健康記録(EHR)の欠落は、この貴重な資源に欠落するデータが豊富にあるため、しばしば妨げられる。
既存の深い計算手法は、計算処理とダウンストリーム解析の両方を組み込んだエンドツーエンドのパイプラインに依存している。
本稿では,モジュール型深層学習型計算・分類パイプラインの開発について検討する。
論文 参考訳(メタデータ) (2024-11-06T14:18:23Z) - InVAErt networks for amortized inference and identifiability analysis of lumped parameter hemodynamic models [0.0]
本研究では、ニューラルネットワークをベースとしたデータ駆動型フレームワークであるinVAErtネットワークを用いて、剛体力学系のディジタル双対解析を強化する。
InVAErtネットワークの柔軟性と有効性について,合成データから欠落成分を含む実データへの6成分ループ型パラメータ血行動態モデルの生理的逆転の文脈で示す。
論文 参考訳(メタデータ) (2024-08-15T17:07:40Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Learnable Prompt as Pseudo-Imputation: Reassessing the Necessity of
Traditional EHR Data Imputation in Downstream Clinical Prediction [16.638760651750744]
既存のディープラーニングトレーニングプロトコルでは、欠落した値を再構築するために統計情報や計算モデルを使用する必要がある。
本稿では,Pseudo Imputation (PAI) を新たなトレーニングプロトコルとして紹介する。
PAIはもはやインプットデータを導入しないが、ダウンストリームモデルの暗黙の選好を欠落値にモデル化するための学習可能なプロンプトを構築する。
論文 参考訳(メタデータ) (2024-01-30T07:19:36Z) - IGNITE: Individualized GeNeration of Imputations in Time-series
Electronic health records [7.451873794596469]
本研究では、患者動態を学習し、個人の人口動態の特徴や治療に合わせたパーソナライズされた値を生成する新しいディープラーニングモデルを提案する。
提案モデルであるIGNITEは,2段階の注意を付加した条件付き2変分オートエンコーダを用いて,個人に対して欠落した値を生成する。
IGNITEは,データ再構成の欠如やタスク予測において,最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-01-09T07:57:21Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Medical data wrangling with sequential variational autoencoders [5.9207487081080705]
本稿では,逐次変分オートエンコーダ(vaes)を用いた異種データ型とバースト欠落データを用いた医療データ記録のモデル化を提案する。
GP-VAEモデルより計算複雑性が低く,両指標を用いた場合,Shi-VAEが最高の性能を発揮することを示す。
論文 参考訳(メタデータ) (2021-03-12T10:59:26Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Learning Dynamic and Personalized Comorbidity Networks from Event Data
using Deep Diffusion Processes [102.02672176520382]
コンコルビンド病は、個人によって異なる複雑な時間的パターンを通じて発生し進行する。
電子的な健康記録では、患者が持つ異なる疾患を観察できるが、それぞれの共死状態の時間的関係を推測できるだけである。
我々は「ダイナミック・コオービディティ・ネットワーク」をモデル化するための深層拡散プロセスを開発する。
論文 参考訳(メタデータ) (2020-01-08T15:47:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。