論文の概要: Integrative Analysis and Imputation of Multiple Data Streams via Deep Gaussian Processes
- arxiv url: http://arxiv.org/abs/2505.12076v1
- Date: Sat, 17 May 2025 16:32:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.0245
- Title: Integrative Analysis and Imputation of Multiple Data Streams via Deep Gaussian Processes
- Title(参考訳): 深いガウス過程による複数データストリームの積分解析と計算
- Authors: Ali Akbar Septiandri, Deyu Ming, F. Alejandro DiazDelaO, Takoua Jendoubi, Samiran Ray,
- Abstract要約: 医療データは分析に3つの重要な課題を提示している。
第一に、生理学的な測定は異なるソースから来るが、本質的には関連している。
第二に、臨床測定は不規則な間隔で行われ、これらのサンプリング時間は臨床的意味を持つ。
- 参考スコア(独自算出の注目度): 0.10870620888258162
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Healthcare data, particularly in critical care settings, presents three key challenges for analysis. First, physiological measurements come from different sources but are inherently related. Yet, traditional methods often treat each measurement type independently, losing valuable information about their relationships. Second, clinical measurements are collected at irregular intervals, and these sampling times can carry clinical meaning. Finally, the prevalence of missing values. Whilst several imputation methods exist to tackle this common problem, they often fail to address the temporal nature of the data or provide estimates of uncertainty in their predictions. We propose using deep Gaussian process emulation with stochastic imputation, a methodology initially conceived to deal with computationally expensive models and uncertainty quantification, to solve the problem of handling missing values that naturally occur in critical care data. This method leverages longitudinal and cross-sectional information and provides uncertainty estimation for the imputed values. Our evaluation of a clinical dataset shows that the proposed method performs better than conventional methods, such as multiple imputations with chained equations (MICE), last-known value imputation, and individually fitted Gaussian Processes (GPs).
- Abstract(参考訳): 医療データ、特に重要なケア環境では、分析に3つの重要な課題が提示される。
第一に、生理学的な測定は異なるソースから来るが、本質的には関連している。
しかし、従来の方法では、それぞれの測定タイプを個別に扱うことが多く、それらの関係に関する貴重な情報が失われる。
第二に、臨床測定は不規則な間隔で行われ、これらのサンプリング時間は臨床的意味を持つ。
最後に、欠落した値の頻度。
この共通問題に対処するためにいくつかの計算方法が存在するが、データの時間的性質に対処したり、予測の不確かさを見積もることに失敗することが多い。
本稿では,計算コストのかかるモデルと不確実性定量化を扱うために考案された手法である確率論的計算を用いた深いガウス過程のエミュレーションを用いて,重要なケアデータに自然に発生する欠落値を扱う問題を解くことを提案する。
本手法は縦断情報と横断情報を活用し,不確かさを推定する。
本手法は, 連鎖方程式を用いた多重計算法 (MICE) , 既知値計算法, 個別適応ガウス過程 (GPs) など, 従来の手法よりも優れていることを示す。
関連論文リスト
- Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation for Time Series [45.76310830281876]
量子回帰に基づくタスクネットワークのアンサンブルを用いて不確実性を推定する新しい手法であるQuantile Sub-Ensemblesを提案する。
提案手法は,高い損失率に頑健な高精度な計算法を生成するだけでなく,非生成モデルの高速な学習により,計算効率も向上する。
論文 参考訳(メタデータ) (2023-12-03T05:52:30Z) - Time-dependent Iterative Imputation for Multivariate Longitudinal
Clinical Data [0.0]
Time-Dependent Iterative Imputationは時系列データを計算するための実用的なソリューションを提供する。
500,000人以上の患者を観察するコホートに応用した場合,本手法は最先端の計算法より優れていた。
論文 参考訳(メタデータ) (2023-04-16T16:10:49Z) - Deep Imputation of Missing Values in Time Series Health Data: A Review
with Benchmarking [0.0]
この調査では,5つの時系列健康データセットに対して,最先端の深層計算手法をベンチマークするために,データ中心の6つの実験を行った。
時系列データにおける欠落した値の縦方向の計算と横方向の計算を共同で行う深層学習法は、従来の計算法よりも統計的に優れたデータ品質が得られる。
論文 参考訳(メタデータ) (2023-02-10T16:03:36Z) - Continuous-Time Modeling of Counterfactual Outcomes Using Neural
Controlled Differential Equations [84.42837346400151]
反現実的な結果を予測することは、パーソナライズされたヘルスケアをアンロックする可能性がある。
既存の因果推論アプローチでは、観察と治療決定の間の通常の離散時間間隔が考慮されている。
そこで本研究では,腫瘍増殖モデルに基づく制御可能なシミュレーション環境を提案する。
論文 参考訳(メタデータ) (2022-06-16T17:15:15Z) - To Impute or not to Impute? -- Missing Data in Treatment Effect
Estimation [84.76186111434818]
我々は,MCM(Mixed Con founded missingness)と呼ばれる新しい欠損機構を同定し,ある欠損度が治療選択を判断し,他の欠損度が治療選択によって決定されることを示した。
本研究は,全てのデータを因果的に入力すると,不偏推定を行うために必要な情報を効果的に除去するので,処理効果のモデルが貧弱になることを示す。
私たちのソリューションは選択的計算であり、CMMからの洞察を使って、どの変数をインプットすべきで、どの変数をインプットすべきでないかを正確に知らせる。
論文 参考訳(メタデータ) (2022-02-04T12:08:31Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - Uncertainty-Aware Variational-Recurrent Imputation Network for Clinical
Time Series [5.485209961772906]
本稿では,命令と予測ネットワークを統一する新しい変分再帰型計算ネットワークを提案する。
具体的には,変数間の分布に基づく計算モデルと,時間的関係を利用する再帰的計算ネットワークを利用する。
論文 参考訳(メタデータ) (2020-03-02T05:12:38Z) - Uncertainty-Gated Stochastic Sequential Model for EHR Mortality
Prediction [6.170898159041278]
本稿では,欠落変数の分布を推定し,隠れ状態の更新を行い,院内死亡の可能性を予測できる新しい変動再帰ネットワークを提案する。
我々のモデルは、これらの手順を1つのストリームで実行し、エンドツーエンドで全てのネットワークパラメータを共同で学習できることは注目に値する。
論文 参考訳(メタデータ) (2020-03-02T04:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。