論文の概要: Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank
- arxiv url: http://arxiv.org/abs/2404.17626v1
- Date: Fri, 26 Apr 2024 16:39:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-30 20:00:20.303706
- Title: Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank
- Title(参考訳): 英国バイオバンクにおける祖先特異的疾患予測のための事前学習と相互作用モデル
- Authors: Thomas Le Menestrel, Erin Craig, Robert Tibshirani, Trevor Hastie, Manuel Rivas,
- Abstract要約: 近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
- 参考スコア(独自算出の注目度): 69.90493129893112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent genome-wide association studies (GWAS) have uncovered the genetic basis of complex traits, but show an under-representation of non-European descent individuals, underscoring a critical gap in genetic research. Here, we assess whether we can improve disease prediction across diverse ancestries using multiomic data. We evaluate the performance of Group-LASSO INTERaction-NET (glinternet) and pretrained lasso in disease prediction focusing on diverse ancestries in the UK Biobank. Models were trained on data from White British and other ancestries and validated across a cohort of over 96,000 individuals for 8 diseases. Out of 96 models trained, we report 16 with statistically significant incremental predictive performance in terms of ROC-AUC scores. These findings suggest that advanced statistical methods that borrow information across multiple ancestries may improve disease risk prediction, but with limited benefit.
- Abstract(参考訳): 近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示し、遺伝的研究における重要なギャップを浮き彫りにしている。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
英国バイオバンクにおける多様な祖先に着目した疾患予測におけるG群LASSO Interaction-NET(glinternet)とプレトレーニングラッソ(pretrained lasso)の性能評価を行った。
モデルは、ホワイト・ブリティッシュや他の祖先のデータに基づいて訓練され、8つの病気に対して96,000人以上の個人からなるコホートで検証された。
訓練した96モデルのうち、統計学的に有意な漸進的な予測性能をROC-AUCスコアで報告した。
これらの結果から,複数の祖先に情報を借りる高度な統計手法は,疾患のリスク予測を改善するが,利益は限定的である可能性が示唆された。
関連論文リスト
- Can Machine Learning Assist in Diagnosis of Primary Immune Thrombocytopenia? A feasibility study [12.4123972735841]
原発性免疫性血小板減少症(ITP)は末梢血血小板の免疫学的破壊を特徴とする稀な自己免疫疾患である。
疾患を確認するための確立された検査はなく、治療と結果に対する反応を予測できるバイオマーカーも存在しない。
日常的な血液検査と人口統計データを用いて, 機械学習をIPPの診断に効果的に適用できるかどうかを, 非急性外来で検討する。
論文 参考訳(メタデータ) (2024-05-31T01:04:46Z) - Large Language Multimodal Models for 5-Year Chronic Disease Cohort Prediction Using EHR Data [15.474201222908107]
糖尿病などの慢性疾患が世界中で致死率と死亡率の主な原因となっている。
我々は,慢性疾患リスクの予測にマルチモーダルデータを組み込んだLarge Language Multimodal Models (LLMMs) フレームワークを提案する。
本手法では, テキスト埋め込みエンコーダとマルチヘッドアテンション層を組み合わせて, 深層ニューラルネットワーク(DNN)モジュールを用いて, 血液の特徴と慢性疾患のセマンティクスを潜在空間にマージする。
論文 参考訳(メタデータ) (2024-03-02T22:33:17Z) - Adapting Machine Learning Diagnostic Models to New Populations Using a
Small Amount of Data: Results from Clinical Neuroscience [17.161866044628205]
我々は、ソースグループからのデータを最適に組み合わせ、ターゲットグループで予測する、重み付き経験的リスク最小化手法を開発した。
本研究では,アルツハイマー病の診断と脳年齢推定のためのMLモデルを構築するため,20の神経画像研究から15,363人のマルチソースデータに適用した。
論文 参考訳(メタデータ) (2023-08-06T18:05:39Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Individualized Prediction of COVID-19 Adverse outcomes with MLHO [9.197411456718708]
我々は、反復的な特徴とアルゴリズムの選択を利用して健康状態を予測するエンドツーエンドの機械学習フレームワークを開発した。
入院前患者の健康状態と人口統計を表わす特徴として,約600点を用いた4つの有害な結果のモデル化を行った。
以上の結果から, 人口統計学的変数は, 新型コロナウイルス感染後の副作用の予測因子として重要であるが, 過去の臨床記録の組み入れは, 信頼性の高い予測モデルに欠かせないことが示唆された。
論文 参考訳(メタデータ) (2020-08-10T02:44:52Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - Short Term Blood Glucose Prediction based on Continuous Glucose
Monitoring Data [53.01543207478818]
本研究では,デジタル意思決定支援ツールの入力として連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データを利用する方法について検討する。
短時間の血液グルコース (STBG) 予測において, リカレントニューラルネットワーク (Recurrent Neural Networks, RNN) をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2020-02-06T16:39:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。