論文の概要: Predicting blood pressure under circumstances of missing data: An
analysis of missing data patterns and imputation methods using NHANES
- arxiv url: http://arxiv.org/abs/2305.01655v1
- Date: Mon, 1 May 2023 18:15:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-04 17:17:19.124081
- Title: Predicting blood pressure under circumstances of missing data: An
analysis of missing data patterns and imputation methods using NHANES
- Title(参考訳): データ欠落状況下での血圧予測:nhanesを用いた欠落データパターンとインプテーション法の解析
- Authors: Harish Chauhan, Nikunj Gupta, Zoe Haskell-Craig
- Abstract要約: CVDは、血圧の上昇、血糖の上昇、血液脂質の上昇、肥満によって影響を受ける。
貧困、ストレス、人種差別といった社会的・環境的な要因も重要な役割を担っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The World Health Organization defines cardio-vascular disease (CVD) as "a
group of disorders of the heart and blood vessels," including coronary heart
disease and stroke (WHO 21). CVD is affected by "intermediate risk factors"
such as raised blood pressure, raised blood glucose, raised blood lipids, and
obesity. These are predominantly influenced by lifestyle and behaviour,
including physical inactivity, unhealthy diets, high intake of salt, and
tobacco and alcohol use. However, genetics and social/environmental factors
such as poverty, stress, and racism also play an important role. Researchers
studying the behavioural and environmental factors associated with these
"intermediate risk factors" need access to high quality and detailed
information on diet and physical activity. However, missing data are a
pervasive problem in clinical and public health research, affecting both
randomized trials and observational studies. Reasons for missing data can vary
substantially across studies because of loss to follow-up, missed study visits,
refusal to answer survey questions, or an unrecorded measurement during an
office visit. One method of handling missing values is to simply delete
observations for which there is missingness (called Complete Case Analysis).
This is rarely used as deleting the data point containing missing data (List
wise deletion) results in a smaller number of samples and thus affects
accuracy. Additional methods of handling missing data exists, such as
summarizing the variables with its observed values (Available Case Analysis).
Motivated by the pervasiveness of missing data in the NHANES dataset, we will
conduct an analysis of imputation methods under different simulated patterns of
missing data. We will then apply these imputation methods to create a complete
dataset upon which we can use ordinary least squares to predict blood pressure
from diet and physical activity.
- Abstract(参考訳): 世界保健機関(WHO)は、心臓血管疾患(CVD)を、冠動脈疾患や脳卒中(WHO 21)を含む「心臓と血管の障害のグループ」と定義している。
CVDは、血圧上昇、血糖上昇、血中脂質上昇、肥満などの「中間的危険因子」の影響を受けている。
これらは主に、身体的不活性、不健康な食事、塩の摂取量、タバコやアルコールの使用など、生活習慣や行動に影響されている。
しかし、貧困、ストレス、人種差別といった社会的・環境的な要因も重要な役割を果たす。
これらの「中間リスク要因」に関連する行動的・環境的要因を研究する研究者は、食事や身体活動に関する高品質で詳細な情報にアクセスする必要がある。
しかし、臨床および公衆衛生研究におけるデータが欠如していることは、ランダム化された治験と観察研究の両方に影響を及ぼす。
データの欠落の原因は、フォローアップの喪失、研究訪問の欠如、調査質問への回答の拒否、オフィス訪問中の記録されていない測定による。
欠落した値を扱う方法の1つは、不足している観察を単に削除することである(Complete Case Analysisと呼ばれる)。
これは、不足しているデータを含むデータポイントの削除(リストワイズ削除)として使われることは滅多になく、結果として少数のサンプルが生成され、精度に影響を及ぼす。
観測された値で変数を要約する(Available Case Analysis)など、欠落データを扱う別の方法が存在する。
NHANESデータセットにおける欠落データの広範性に触発されて、欠落データの異なるシミュレートパターンの下で、計算方法の解析を行う。
次に、これらのインプテーション法を適用して、食事や身体活動から血圧を予測するために、通常の最小二乗法を使用できる完全なデータセットを作成する。
関連論文リスト
- Fuzzy Rule based Intelligent Cardiovascular Disease Prediction using Complex Event Processing [0.8668211481067458]
心血管疾患 (CVD) は、不健康な食事、身体活動の欠如、その他の要因により、急速に世界的な懸念が高まっている。
最近の研究は、リスクと死亡率を減らすための正確でタイムリーな病気予測に焦点を当てている。
本稿では,リアルタイム意思決定支援のためのファジィルールに基づく臨床データ監視システムを提案する。
論文 参考訳(メタデータ) (2024-09-19T16:36:24Z) - Stressor Type Matters! -- Exploring Factors Influencing Cross-Dataset Generalizability of Physiological Stress Detection [5.304745246313982]
本研究では,2次応力検出のためのHRV機能に基づいて学習した機械学習モデルの一般化可能性について検討する。
以上の結果から,モデル一般化可能性に重要な因子であるストレスタイプが示唆された。
我々は、新しい環境にHRVベースのストレスモデルを展開する際に、ストレスタイプをマッチングすることを推奨する。
論文 参考訳(メタデータ) (2024-05-06T14:47:48Z) - Interpretable Causal Inference for Analyzing Wearable, Sensor, and Distributional Data [62.56890808004615]
本研究では,信頼性とロバストな意思決定を確実にする,分散データ解析の解釈可能な手法を開発した。
ADD MALTSの有用性について,糖尿病リスク軽減のための連続グルコースモニターの有効性について検討した。
論文 参考訳(メタデータ) (2023-12-17T00:42:42Z) - Towards Assessing Data Bias in Clinical Trials [0.0]
医療データセットはデータバイアスの影響を受けます。
データバイアスは現実の歪んだ見方を与え、誤った分析結果をもたらし、結果として決定を下す。
i)データセットに存在する可能性のあるデータバイアスの種類を定義し、(ii)適切なメトリクスでデータバイアスを特徴付け、定量化し、(iii)異なるデータソースに対してデータバイアスを特定し、測定し、緩和するためのガイドラインを提供する。
論文 参考訳(メタデータ) (2022-12-19T17:10:06Z) - Comparison of Missing Data Imputation Methods using the Framingham Heart
study dataset [0.0]
我々は,GAN(Generative Adversarial Networks)とオートエンコーダに基づいて,最先端の欠落値計算手法を検証・修正する。
データ計算とポストインプット予測の両方のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-10-06T18:35:08Z) - Why Interpretable Causal Inference is Important for High-Stakes Decision
Making for Critically Ill Patients and How To Do It [80.24494623756839]
重症心身障害患者に対する因果関係評価のための枠組みを提案する。
この枠組みは、脳の発作やその他の潜在的に有害な電気的事象が結果に与える影響に適用する。
論文 参考訳(メタデータ) (2022-03-09T18:03:35Z) - To Impute or not to Impute? -- Missing Data in Treatment Effect
Estimation [84.76186111434818]
我々は,MCM(Mixed Con founded missingness)と呼ばれる新しい欠損機構を同定し,ある欠損度が治療選択を判断し,他の欠損度が治療選択によって決定されることを示した。
本研究は,全てのデータを因果的に入力すると,不偏推定を行うために必要な情報を効果的に除去するので,処理効果のモデルが貧弱になることを示す。
私たちのソリューションは選択的計算であり、CMMからの洞察を使って、どの変数をインプットすべきで、どの変数をインプットすべきでないかを正確に知らせる。
論文 参考訳(メタデータ) (2022-02-04T12:08:31Z) - An introduction to causal reasoning in health analytics [2.199093822766999]
従来の機械学習と統計的アプローチで発生する可能性のある欠点のいくつかを強調して、観測データを分析します。
一般的な機械学習問題に対処するための因果推論の応用を実演する。
論文 参考訳(メタデータ) (2021-05-10T20:25:56Z) - Personalized pathology test for Cardio-vascular disease: Approximate
Bayesian computation with discriminative summary statistics learning [48.7576911714538]
近似計算を用いて生物学的に有意なパラメータを推定するための血小板沈着モデルと推論手法を提案する。
この研究は、CVDの検出と治療のためのパーソナライズされた病理検査の先例のない機会を開く。
論文 参考訳(メタデータ) (2020-10-13T15:20:21Z) - Robustness to Spurious Correlations via Human Annotations [100.63051542531171]
本稿では,人間に共通する因果関係の知識を活用して,素因関係に頑健なモデルを構築するための枠組みを提案する。
具体的には、人間のアノテーションを使用して、潜在的な未測定変数でトレーニング例を拡大する。
次に,未測定変数(UV-DRO)に対する分布性に頑健な新たな最適化手法を導入し,テスト時間シフトによる最悪の損失を制御する。
論文 参考訳(メタデータ) (2020-07-13T20:05:19Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。