論文の概要: Medical data wrangling with sequential variational autoencoders
- arxiv url: http://arxiv.org/abs/2103.07206v1
- Date: Fri, 12 Mar 2021 10:59:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-15 19:42:53.871116
- Title: Medical data wrangling with sequential variational autoencoders
- Title(参考訳): 逐次変分オートエンコーダを用いた医用データラング
- Authors: Daniel Barrej\'on, Pablo M. Olmos, Antonio Art\'es-Rodr\'iguez
- Abstract要約: 本稿では,逐次変分オートエンコーダ(vaes)を用いた異種データ型とバースト欠落データを用いた医療データ記録のモデル化を提案する。
GP-VAEモデルより計算複雑性が低く,両指標を用いた場合,Shi-VAEが最高の性能を発揮することを示す。
- 参考スコア(独自算出の注目度): 5.9207487081080705
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical data sets are usually corrupted by noise and missing data. These
missing patterns are commonly assumed to be completely random, but in medical
scenarios, the reality is that these patterns occur in bursts due to sensors
that are off for some time or data collected in a misaligned uneven fashion,
among other causes. This paper proposes to model medical data records with
heterogeneous data types and bursty missing data using sequential variational
autoencoders (VAEs). In particular, we propose a new methodology, the Shi-VAE,
which extends the capabilities of VAEs to sequential streams of data with
missing observations. We compare our model against state-of-the-art solutions
in an intensive care unit database (ICU) and a dataset of passive human
monitoring. Furthermore, we find that standard error metrics such as RMSE are
not conclusive enough to assess temporal models and include in our analysis the
cross-correlation between the ground truth and the imputed signal. We show that
Shi-VAE achieves the best performance in terms of using both metrics, with
lower computational complexity than the GP-VAE model, which is the
state-of-the-art method for medical records.
- Abstract(参考訳): 医療データセットは通常、ノイズや欠落したデータによって破損する。
これらの欠落パターンは、一般的には完全にランダムであると仮定されるが、医学的なシナリオでは、このパターンは一定期間オフになっているセンサーや、不均一な方法で収集されたデータなどによってバーストで発生する。
本論文では,医用データレコードを不均一なデータ型とバースト的欠落データとでモデル化することを提案する。
特に,観測の欠如したデータストリームにvaesの機能を拡張する新しい手法であるshi-vaeを提案する。
我々は、集中治療単位データベース(ICU)と受動的人体監視データセットにおける最先端のソリューションと比較した。
さらに,rmseなどの標準誤差指標は,時間モデルを評価するのに十分な決定性を持たず,基礎的真理と含意的信号との相互相関を解析した。
本研究では,医療記録の最先端の手法であるGP-VAEモデルよりも計算の複雑性が低く,両指標の使い勝手が最良であることを示した。
関連論文リスト
- MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - MURAL: An Unsupervised Random Forest-Based Embedding for Electronic
Health Record Data [59.26381272149325]
異なる変数型でデータを表現するための教師なしランダムフォレストを提案する。
muraL forestsは、ノード分割変数がランダムに選択される一連の決定ツリーで構成されている。
提案手法を用いることで,競合するアプローチよりも正確なデータの視覚化と分類が可能であることを示す。
論文 参考訳(メタデータ) (2021-11-19T22:02:21Z) - DAE : Discriminatory Auto-Encoder for multivariate time-series anomaly
detection in air transportation [68.8204255655161]
識別オートエンコーダ(DAE)と呼ばれる新しい異常検出モデルを提案する。
通常のLSTMベースのオートエンコーダのベースラインを使用するが、いくつかのデコーダがあり、それぞれ特定の飛行フェーズのデータを取得する。
その結果,DAEは精度と検出速度の両方で良好な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-09-08T14:07:55Z) - Sequential Diagnosis Prediction with Transformer and Ontological
Representation [35.88195694025553]
本稿では,患者が訪問する時間スタンプと滞在時間との間に不規則な間隔を対応させるSETORと呼ばれる,エンドツーエンドの頑健なトランスフォーマーモデルを提案する。
2つの実世界の医療データセットで実施された実験により、シーケンシャルな診断予測モデルSETORは、従来の最先端のアプローチよりも優れた予測結果が得られることが示された。
論文 参考訳(メタデータ) (2021-09-07T13:09:55Z) - Harmonization with Flow-based Causal Inference [12.739380441313022]
本稿では, 医療データを調和させる構造因果モデル (SCM) に対して, 反実的推論を行う正規化フローに基づく手法を提案する。
我々は,この手法が最先端のアルゴリズムよりもドメイン間一般化に寄与することを示すために,複数の,大規模な実世界の医療データセットを評価した。
論文 参考訳(メタデータ) (2021-06-12T19:57:35Z) - Handling Non-ignorably Missing Features in Electronic Health Records
Data Using Importance-Weighted Autoencoders [8.518166245293703]
本稿では,生体データのランダムなパターンではなく,欠落を柔軟に扱うために,重要度重み付きオートエンコーダ(iwaes)と呼ばれるvaesの新たな拡張を提案する。
提案手法は,組み込みニューラルネットワークを用いて欠落機構をモデル化し,欠落機構の正確な形式を事前に指定する必要をなくした。
論文 参考訳(メタデータ) (2021-01-18T22:53:29Z) - VAEs in the Presence of Missing Data [6.397263087026567]
我々は、欠落したデータを生成する汚職過程の新しい潜伏変数モデルを開発し、対応する抽出可能なエビデンスローバウンド(ELBO)を導出する。
我々のモデルは実装が簡単で、無作為データ(MCAR)と無作為データ(MNAR)の両方を処理でき、高次元入力にスケールし、データ要素が欠落しているか否かの指標変数にVAEエンコーダとデコーダの両方にアクセスできる。
MNISTとSVHNデータセットでは、既存のアプローチと比較して、観測データの辺りのログライクな改善と、データ計算の欠如の改善が示されている。
論文 参考訳(メタデータ) (2020-06-09T14:40:00Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Multiple Imputation for Biomedical Data using Monte Carlo Dropout
Autoencoders [0.0]
本稿では,モンテカルロの(可変)オートエンコーダ内におけるドロップアウトに基づくアプローチを提案する。
提案手法により,計算誤差と予測類似性を改善することができることを示す。
論文 参考訳(メタデータ) (2020-05-13T06:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。