論文の概要: A Hamiltonian Monte Carlo Model for Imputation and Augmentation of
Healthcare Data
- arxiv url: http://arxiv.org/abs/2103.02349v1
- Date: Wed, 3 Mar 2021 11:57:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-04 15:09:39.419182
- Title: A Hamiltonian Monte Carlo Model for Imputation and Augmentation of
Healthcare Data
- Title(参考訳): 医療データのインプテーションと拡張のためのハミルトンモンテカルロモデル
- Authors: Narges Pourshahrokhi, Samaneh Kouchaki, Kord M. Kober, Christine
Miaskowski, Payam Barnaghi
- Abstract要約: 変数や質問のデータが収集されないか利用できないため、ほとんどすべての臨床研究に不足する値が存在します。
既存のモデルは通常、プライバシの懸念を考慮せず、複数の機能にまたがる固有の相関を利用していない。
本研究では, 欠落値のインプットと高次元医療データへの付加的サンプル生成に対するベイズ的アプローチを提案する。
- 参考スコア(独自算出の注目度): 0.6719751155411076
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Missing values exist in nearly all clinical studies because data for a
variable or question are not collected or not available. Inadequate handling of
missing values can lead to biased results and loss of statistical power in
analysis. Existing models usually do not consider privacy concerns or do not
utilise the inherent correlations across multiple features to impute the
missing values. In healthcare applications, we are usually confronted with high
dimensional and sometimes small sample size datasets that need more effective
augmentation or imputation techniques. Besides, imputation and augmentation
processes are traditionally conducted individually. However, imputing missing
values and augmenting data can significantly improve generalisation and avoid
bias in machine learning models. A Bayesian approach to impute missing values
and creating augmented samples in high dimensional healthcare data is proposed
in this work. We propose folded Hamiltonian Monte Carlo (F-HMC) with Bayesian
inference as a more practical approach to process the cross-dimensional
relations by applying a random walk and Hamiltonian dynamics to adapt posterior
distribution and generate large-scale samples. The proposed method is applied
to a cancer symptom assessment dataset and confirmed to enrich the quality of
data in precision, accuracy, recall, F1 score, and propensity metric.
- Abstract(参考訳): 変数や質問のデータが収集されないか利用できないため、ほとんどすべての臨床研究に不足する値が存在します。
不足値の不十分な処理は、バイアス結果と分析における統計力の喪失につながる可能性があります。
既存のモデルは通常、プライバシの懸念を考慮せず、複数の機能にまたがる固有の相関を利用していない。
ヘルスケアアプリケーションでは、通常、より効果的な増強またはインプット技術を必要とする高次元および時々小さなサンプルサイズのデータセットに直面しています。
さらに、インプテーションと拡張プロセスは伝統的に個別に行われる。
しかし、値の欠落とデータの強化は、一般化を著しく改善し、機械学習モデルのバイアスを避けることができる。
本研究では, 欠落値のインプットと高次元医療データへの付加的サンプル生成に対するベイズ的アプローチを提案する。
本研究では, ランダムウォークとハミルトン力学を適用して, 後方分布に適応し, 大規模サンプルを生成することにより, ベイズ推定を用いた折り畳みハミルトニアンモンテカルロ(F-HMC)を提案する。
提案手法は, 癌症状評価データセットに適用し, 正確性, 正確性, 記憶率, f1スコア, 傾向指標などのデータ品質を高める。
関連論文リスト
- Handling Overlapping Asymmetric Datasets -- A Twice Penalized P-Spline
Approach [0.40964539027092917]
本研究の目的は,特定の応答に対してより小さなコホートをモデル化できる新しい手法を開発することである。
線形B-SplineとP-Spline近似の2倍のペナル化手法により、線形B-SplineとP-Spline近似との適合性が向上することがわかった。
非アルコール性脂肪肝炎の発症リスクに関する実生活データセットに適用すると、モデル適合性は65%以上向上する。
論文 参考訳(メタデータ) (2023-11-17T12:41:07Z) - Towards frugal unsupervised detection of subtle abnormalities in medical
imaging [0.0]
医用画像における異常検出は、異常が注釈付けされていない状況では難しい課題である。
汎用性が広く認識されている確率分布の混合について検討する。
このオンラインアプローチは、新たに診断されたパーキンソン病患者の追跡において、MR脳スキャンの微妙な異常の検出が困難であることを示すものである。
論文 参考訳(メタデータ) (2023-09-04T07:44:54Z) - Robust self-healing prediction model for high dimensional data [0.685316573653194]
本研究は、ロバスト自己治癒(RSH)ハイブリッド予測モデルを提案する。
それは、データを捨てるのではなく、エラーや不整合を取り除くことによって、データ全体を活用することによって機能する。
提案手法は,既存のハイパフォーマンスモデルと比較し,解析を行った。
論文 参考訳(メタデータ) (2022-10-04T17:55:50Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Medical data wrangling with sequential variational autoencoders [5.9207487081080705]
本稿では,逐次変分オートエンコーダ(vaes)を用いた異種データ型とバースト欠落データを用いた医療データ記録のモデル化を提案する。
GP-VAEモデルより計算複雑性が低く,両指標を用いた場合,Shi-VAEが最高の性能を発揮することを示す。
論文 参考訳(メタデータ) (2021-03-12T10:59:26Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - A random shuffle method to expand a narrow dataset and overcome the
associated challenges in a clinical study: a heart failure cohort example [50.591267188664666]
本研究の目的は、統計的に合法なHFデータセットのカーディナリティを高めるためにランダムシャッフル法を設計することであった。
提案されたランダムシャッフル法は、HFデータセットのカーディナリティを10回、およびランダムな繰り返し測定アプローチに続いて21回向上させることができた。
論文 参考訳(メタデータ) (2020-12-12T10:59:38Z) - VAEs in the Presence of Missing Data [6.397263087026567]
我々は、欠落したデータを生成する汚職過程の新しい潜伏変数モデルを開発し、対応する抽出可能なエビデンスローバウンド(ELBO)を導出する。
我々のモデルは実装が簡単で、無作為データ(MCAR)と無作為データ(MNAR)の両方を処理でき、高次元入力にスケールし、データ要素が欠落しているか否かの指標変数にVAEエンコーダとデコーダの両方にアクセスできる。
MNISTとSVHNデータセットでは、既存のアプローチと比較して、観測データの辺りのログライクな改善と、データ計算の欠如の改善が示されている。
論文 参考訳(メタデータ) (2020-06-09T14:40:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。