論文の概要: Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank
- arxiv url: http://arxiv.org/abs/2404.17626v2
- Date: Tue, 7 May 2024 16:21:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-08 18:53:50.436894
- Title: Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank
- Title(参考訳): 英国バイオバンクにおける祖先特異的疾患予測のための事前学習と相互作用モデル
- Authors: Thomas Le Menestrel, Erin Craig, Robert Tibshirani, Trevor Hastie, Manuel Rivas,
- Abstract要約: 近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
- 参考スコア(独自算出の注目度): 69.90493129893112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent genome-wide association studies (GWAS) have uncovered the genetic basis of complex traits, but show an under-representation of non-European descent individuals, underscoring a critical gap in genetic research. Here, we assess whether we can improve disease prediction across diverse ancestries using multiomic data. We evaluate the performance of Group-LASSO INTERaction-NET (glinternet) and pretrained lasso in disease prediction focusing on diverse ancestries in the UK Biobank. Models were trained on data from White British and other ancestries and validated across a cohort of over 96,000 individuals for 8 diseases. Out of 96 models trained, we report 16 with statistically significant incremental predictive performance in terms of ROC-AUC scores (p-value < 0.05), found for diabetes, arthritis, gall stones, cystitis, asthma and osteoarthritis. For the interaction and pretrained models that outperformed the baseline, the PRS score was the primary driver behind prediction. Our findings indicate that both interaction terms and pre-training can enhance prediction accuracy but for a limited set of diseases and moderate improvements in accuracy
- Abstract(参考訳): 近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示し、遺伝的研究における重要なギャップを浮き彫りにしている。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
英国バイオバンクにおける多様な祖先に着目した疾患予測におけるG群LASSO Interaction-NET(glinternet)とプレトレーニングラッソ(pretrained lasso)の性能評価を行った。
モデルは、ホワイト・ブリティッシュや他の祖先のデータに基づいて訓練され、8つの病気に対して96,000人以上の個人からなるコホートで検証された。
トレーニングした96モデルのうち, 糖尿病, 関節炎, 胆石, 嚢胞炎, 喘息, 変形性関節症において, ROC-AUC スコア (p-value < 0.05) で統計学的に有意な漸増性予測性能を示した16例を報告した。
ベースラインを上回った相互作用モデルと事前訓練されたモデルでは、PSSスコアが予測の背後にある主要なドライバとなった。
以上の結果から, 相互作用項と事前学習の両方が予測精度を向上するが, 限られた疾患のセットと適度な精度向上に寄与することが示唆された。
関連論文リスト
- Enhancing End Stage Renal Disease Outcome Prediction: A Multi-Sourced Data-Driven Approach [7.212939068975618]
10,326人のCKD患者のデータを利用して,2009年から2018年までの臨床とクレーム情報を組み合わせた。
24ヶ月の観測窓は早期検出と予測精度のバランスをとるのに最適であると同定された。
2021年のeGFR方程式は予測精度を改善し、特にアフリカ系アメリカ人の偏見を低減した。
論文 参考訳(メタデータ) (2024-10-02T03:21:01Z) - From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [50.80532910808962]
GluFormerは、トランスフォーマーアーキテクチャに基づく生体医学的時間的データの生成基盤モデルである。
GluFormerは5つの地理的領域にまたがる4936人を含む15の異なる外部データセットに一般化されている。
今後4年間の健康状態も予測できる。
論文 参考訳(メタデータ) (2024-08-20T13:19:06Z) - Can Machine Learning Assist in Diagnosis of Primary Immune Thrombocytopenia? A feasibility study [12.4123972735841]
原発性免疫性血小板減少症(ITP)は末梢血血小板の免疫学的破壊を特徴とする稀な自己免疫疾患である。
疾患を確認するための確立された検査はなく、治療と結果に対する反応を予測できるバイオマーカーも存在しない。
日常的な血液検査と人口統計データを用いて, 機械学習をIPPの診断に効果的に適用できるかどうかを, 非急性外来で検討する。
論文 参考訳(メタデータ) (2024-05-31T01:04:46Z) - Adapting Machine Learning Diagnostic Models to New Populations Using a Small Amount of Data: Results from Clinical Neuroscience [21.420302408947194]
我々は、ソースグループからのデータを最適に組み合わせ、ターゲットグループで予測する、重み付き経験的リスク最小化手法を開発した。
本研究では,アルツハイマー病の診断と脳年齢推定のためのMLモデルを構築するため,20の神経画像研究から15,363人のマルチソースデータに適用した。
論文 参考訳(メタデータ) (2023-08-06T18:05:39Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Individualized Prediction of COVID-19 Adverse outcomes with MLHO [9.197411456718708]
我々は、反復的な特徴とアルゴリズムの選択を利用して健康状態を予測するエンドツーエンドの機械学習フレームワークを開発した。
入院前患者の健康状態と人口統計を表わす特徴として,約600点を用いた4つの有害な結果のモデル化を行った。
以上の結果から, 人口統計学的変数は, 新型コロナウイルス感染後の副作用の予測因子として重要であるが, 過去の臨床記録の組み入れは, 信頼性の高い予測モデルに欠かせないことが示唆された。
論文 参考訳(メタデータ) (2020-08-10T02:44:52Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - Short Term Blood Glucose Prediction based on Continuous Glucose
Monitoring Data [53.01543207478818]
本研究では,デジタル意思決定支援ツールの入力として連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データを利用する方法について検討する。
短時間の血液グルコース (STBG) 予測において, リカレントニューラルネットワーク (Recurrent Neural Networks, RNN) をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2020-02-06T16:39:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。