論文の概要: What is Hiding in Medicine's Dark Matter? Learning with Missing Data in
Medical Practices
- arxiv url: http://arxiv.org/abs/2402.06563v1
- Date: Fri, 9 Feb 2024 17:27:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 15:47:22.283215
- Title: What is Hiding in Medicine's Dark Matter? Learning with Missing Data in
Medical Practices
- Title(参考訳): 薬のダークマターに何が隠されている?
医療におけるデータの欠如による学習
- Authors: Neslihan Suzen, Evgeny M. Mirkes, Damian Roland, Jeremy Levesley,
Alexander N. Gorban, Tim J. Coats
- Abstract要約: 欠落したデータは、医療専門家の実践パターンに関連付けられている可能性がある。
外傷例5,791例のTARNフィールド79例について検討した。
我々は,1NNインプタが,通常の臨床意思決定のパターンを示す最も優れたインキュベーションであると結論づけた。
- 参考スコア(独自算出の注目度): 38.64139739520114
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Electronic patient records (EPRs) produce a wealth of data but contain
significant missing information. Understanding and handling this missing data
is an important part of clinical data analysis and if left unaddressed could
result in bias in analysis and distortion in critical conclusions. Missing data
may be linked to health care professional practice patterns and imputation of
missing data can increase the validity of clinical decisions. This study
focuses on statistical approaches for understanding and interpreting the
missing data and machine learning based clinical data imputation using a single
centre's paediatric emergency data and the data from UK's largest clinical
audit for traumatic injury database (TARN). In the study of 56,961 data points
related to initial vital signs and observations taken on children presenting to
an Emergency Department, we have shown that missing data are likely to be
non-random and how these are linked to health care professional practice
patterns. We have then examined 79 TARN fields with missing values for 5,791
trauma cases. Singular Value Decomposition (SVD) and k-Nearest Neighbour (kNN)
based missing data imputation methods are used and imputation results against
the original dataset are compared and statistically tested. We have concluded
that the 1NN imputer is the best imputation which indicates a usual pattern of
clinical decision making: find the most similar patients and take their
attributes as imputation.
- Abstract(参考訳): 電子的患者記録(EPR)は豊富なデータを生成するが、重大な欠落情報を含んでいる。
この欠落したデータの理解と処理は、臨床データ分析の重要な部分であり、もし未修正のままなら、批判的な結論における分析と歪みのバイアスをもたらす可能性がある。
不足したデータは、医療専門家の行動パターンと関連付けられ、欠如したデータのインプットは、臨床決定の妥当性を高める可能性がある。
本研究は、単一センターの小児救急データと、英国最大の外傷性外傷データベース(TARN)の臨床監査データを用いて、欠失データと機械学習に基づく臨床データ計算の統計的理解と解釈に焦点をあてる。
救急科に紹介された小児の生命徴候と観察に関する56,961点のデータポイントについて検討した結果,欠如したデータが非ランダムである可能性が示唆され,医療従事者の行動パターンとの関連性が示唆された。
外傷例5,791例のTARNフィールド79例について検討した。
Singular Value Decomposition (SVD) と k-Nearest Neighbour (kNN) に基づく欠落データ計算手法を使用し、元のデータセットに対する計算結果を比較し、統計的に検証する。
我々は,最も類似した患者を見つけ,その属性をインキュベーションとみなすという,通常の臨床意思決定のパターンを示す最も優れたインキュベーションであると結論付けている。
関連論文リスト
- SepsisLab: Early Sepsis Prediction with Uncertainty Quantification and Active Sensing [67.8991481023825]
セプシスは米国での院内死亡の主な原因である。
既存の予測モデルは通常、情報不足の少ない高品質なデータで訓練される。
限られた観察により信頼性の低い高リスク患者に対して,ロバストな能動センシングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:47:36Z) - Causal thinking for decision making on Electronic Health Records: why
and how [0.0]
データ駆動決定には因果思考が必要である。
実生活の患者記録から有効な意思決定を支援するための,ステップバイステップのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T08:17:00Z) - Temporal-spatial Correlation Attention Network for Clinical Data
Analysis in Intensive Care Unit [27.885961694582896]
本稿では,臨床特性予測問題に対処するための時間・適応相関注意ネットワーク(TSCAN)を提案する。
本手法は,アテンションメカニズムモデルの設計に基づいて,臨床データおよび無関係ノードにおける無関係項目を効果的に除去することができる。
また,治療方法の改善に有効な重要な結果を示す重要な臨床指標も見出すことができる。
論文 参考訳(メタデータ) (2023-06-03T00:38:40Z) - Time-dependent Iterative Imputation for Multivariate Longitudinal
Clinical Data [0.0]
Time-Dependent Iterative Imputationは時系列データを計算するための実用的なソリューションを提供する。
500,000人以上の患者を観察するコホートに応用した場合,本手法は最先端の計算法より優れていた。
論文 参考訳(メタデータ) (2023-04-16T16:10:49Z) - Towards Assessing Data Bias in Clinical Trials [0.0]
医療データセットはデータバイアスの影響を受けます。
データバイアスは現実の歪んだ見方を与え、誤った分析結果をもたらし、結果として決定を下す。
i)データセットに存在する可能性のあるデータバイアスの種類を定義し、(ii)適切なメトリクスでデータバイアスを特徴付け、定量化し、(iii)異なるデータソースに対してデータバイアスを特定し、測定し、緩和するためのガイドラインを提供する。
論文 参考訳(メタデータ) (2022-12-19T17:10:06Z) - Comparison of Missing Data Imputation Methods using the Framingham Heart
study dataset [0.0]
我々は,GAN(Generative Adversarial Networks)とオートエンコーダに基づいて,最先端の欠落値計算手法を検証・修正する。
データ計算とポストインプット予測の両方のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-10-06T18:35:08Z) - The pitfalls of using open data to develop deep learning solutions for
COVID-19 detection in chest X-rays [64.02097860085202]
深層学習モデルは、胸部X線から新型コロナウイルスを識別するために開発された。
オープンソースデータのトレーニングやテストでは,結果は異例です。
データ分析とモデル評価は、人気のあるオープンソースデータセットであるCOVIDxが実際の臨床問題を代表していないことを示している。
論文 参考訳(メタデータ) (2021-09-14T10:59:11Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。