論文の概要: Evaluating the performance of personal, social, health-related,
biomarker and genetic data for predicting an individuals future health using
machine learning: A longitudinal analysis
- arxiv url: http://arxiv.org/abs/2104.12516v1
- Date: Mon, 26 Apr 2021 12:31:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 21:41:55.089637
- Title: Evaluating the performance of personal, social, health-related,
biomarker and genetic data for predicting an individuals future health using
machine learning: A longitudinal analysis
- Title(参考訳): 機械学習を用いた個人の将来健康予測のための個人・社会・健康・バイオマーカー・遺伝子データの性能評価--縦断分析
- Authors: Mark Green
- Abstract要約: この研究の目的は、個人、社会、健康関連、バイオマーカーおよび遺伝データの相対的貢献を個人における将来の健康の予測因子として識別するために機械学習アプローチを適用することである。
ニューラルネットワークによるディープラーニングとXGBoostという,予測モデル構築に2つの機械学習アプローチが使用された。
その結果、健康関連の指標が将来の健康状態を最も予測し、遺伝データが劣っていることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As we gain access to a greater depth and range of health-related information
about individuals, three questions arise: (1) Can we build better models to
predict individual-level risk of ill health? (2) How much data do we need to
effectively predict ill health? (3) Are new methods required to process the
added complexity that new forms of data bring? The aim of the study is to apply
a machine learning approach to identify the relative contribution of personal,
social, health-related, biomarker and genetic data as predictors of future
health in individuals. Using longitudinal data from 6830 individuals in the UK
from Understanding Society (2010-12 to 2015-17), the study compares the
predictive performance of five types of measures: personal (e.g. age, sex),
social (e.g. occupation, education), health-related (e.g. body weight, grip
strength), biomarker (e.g. cholesterol, hormones) and genetic single nucleotide
polymorphisms (SNPs). The predicted outcome variable was limiting long-term
illness one and five years from baseline. Two machine learning approaches were
used to build predictive models: deep learning via neural networks and XGBoost
(gradient boosting decision trees). Model fit was compared to traditional
logistic regression models. Results found that health-related measures had the
strongest prediction of future health status, with genetic data performing
poorly. Machine learning models only offered marginal improvements in model
accuracy when compared to logistic regression models, but also performed well
on other metrics e.g. neural networks were best on AUC and XGBoost on
precision. The study suggests that increasing complexity of data and methods
does not necessarily translate to improved understanding of the determinants of
health or performance of predictive models of ill health.
- Abstract(参考訳): 個人に関するより深い情報と幅広い健康関連情報にアクセスできるようになると、(1)個人レベルの健康リスクを予測するためのより良いモデルを構築することができるか?
2)健康状態を効果的に予測するには,どの程度のデータが必要か?
3) 新たなデータ形式がもたらした複雑さを処理するための新しいメソッドは必要か?
本研究の目的は、個人における将来の健康の予測因子として、個人、社会、健康、バイオマーカー、遺伝データの相対的な寄与を特定するための機械学習アプローチを適用することである。
英国理解協会(2010-12-2015-17)の6830人の縦データを用いて、個人(例えば、個人)の5種類の指標の予測性能を比較した。
年齢、性別、社会性(例)
職業、教育、健康関連(例)
体重、握力、バイオマーカー(例)
コレステロール、ホルモン、遺伝性単一ヌクレオチド多型(SNP)。
予測結果の変動は, ベースラインから1~5年後の長期疾患を制限していた。
ニューラルネットワークによるディープラーニング(deep learning)とXGBoost(gradient boosting decision tree)という2つの機械学習アプローチが予測モデルの構築に使用された。
モデル適合は従来のロジスティック回帰モデルと比較された。
その結果,健康関連指標は今後の健康状態の予測に最も優れており,遺伝データが不十分であった。
機械学習モデルは、ロジスティック回帰モデルと比較してモデル精度が極端に向上しただけでなく、他の指標でも良好に機能した。
ニューラルネットワークはAUCとXGBoostの精度が最も高かった。
この研究は、データと手法の複雑さの増加は必ずしも健康の要因や健康の予測モデルの性能の理解を改善するものではないことを示唆している。
関連論文リスト
- Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Predictive Modeling for Breast Cancer Classification in the Context of Bangladeshi Patients: A Supervised Machine Learning Approach with Explainable AI [0.0]
5種類の機械学習手法の分類精度,精度,リコール,F-1スコアを評価し,比較した。
XGBoostは97%という最高のモデル精度を達成した。
論文 参考訳(メタデータ) (2024-04-06T17:23:21Z) - Recent Advances in Predictive Modeling with Electronic Health Records [73.31880579203012]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - Towards a Transportable Causal Network Model Based on Observational
Healthcare Data [1.333879175460266]
本稿では,選択図,不足グラフ,因果発見,事前知識を1つのグラフィカルモデルに組み合わせた新しい手法を提案する。
このモデルは、患者の2つの異なるコホートからなるデータから学習する。
結果として得られた因果ネットワークモデルは、リスク評価、正確性、説明可能性の観点から専門家臨床医によって検証される。
論文 参考訳(メタデータ) (2023-11-13T13:23:31Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Machine Learning-based Biological Ageing Estimation Technologies: A
Survey [2.9554549423413303]
機械学習(ML)を用いた3つの年齢予測手法について概説する。
血液バイオマーカー、顔画像、構造的特徴をベースとしている。
予測精度はあまり良くないため、医療分野に多大な貢献はできない。
論文 参考訳(メタデータ) (2022-06-25T13:38:39Z) - Interpretable machine learning for high-dimensional trajectories of
aging health [0.0]
我々は、健康と生存の個人的高齢軌跡の計算モデルを構築した。
身体的、機能的、生物学的な変数を含み、人口動態、生活様式、医学的背景情報に依存する。
我々のモデルは大規模縦型データセットにスケーラブルであり、健康変数間の有向相互作用の解釈可能なネットワークを推定する。
論文 参考訳(メタデータ) (2021-05-07T17:42:15Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Deep learning for prediction of population health costs [0.0]
我々は、健康保険請求記録から将来のコストを予測するディープニューラルネットワークを開発した。
深層ネットワークと隆起回帰モデルを用いて, ドイツの保険業者14万人を対象に, 全1年間の医療費の予測を行った。
論文 参考訳(メタデータ) (2020-03-06T23:33:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。