論文の概要: Improving genetic risk prediction across diverse population by
disentangling ancestry representations
- arxiv url: http://arxiv.org/abs/2205.04673v1
- Date: Tue, 10 May 2022 05:05:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-14 19:29:01.921190
- Title: Improving genetic risk prediction across diverse population by
disentangling ancestry representations
- Title(参考訳): 異種個体群間における遺伝的リスク予測の改善
- Authors: Prashnna K Gyawali, Yann Le Guen, Xiaoxia Liu, Hua Tang, James Zou,
Zihuai He
- Abstract要約: 本稿では,表現型関連情報から祖先を遠ざける新しいディープラーニングフレームワークを提案する。
祖先が混ざり合った表現は、少数民族の間でより良いパフォーマンスを示すリスク予測器を構築するのに使うことができる。
- 参考スコア(独自算出の注目度): 10.803542340843368
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Risk prediction models using genetic data have seen increasing traction in
genomics. However, most of the polygenic risk models were developed using data
from participants with similar (mostly European) ancestry. This can lead to
biases in the risk predictors resulting in poor generalization when applied to
minority populations and admixed individuals such as African Americans. To
address this bias, largely due to the prediction models being confounded by the
underlying population structure, we propose a novel deep-learning framework
that leverages data from diverse population and disentangles ancestry from the
phenotype-relevant information in its representation. The ancestry disentangled
representation can be used to build risk predictors that perform better across
minority populations. We applied the proposed method to the analysis of
Alzheimer's disease genetics. Comparing with standard linear and nonlinear risk
prediction methods, the proposed method substantially improves risk prediction
in minority populations, particularly for admixed individuals.
- Abstract(参考訳): 遺伝データを用いたリスク予測モデルは、ゲノム学において勢いを増している。
しかし、ほとんどのポリジェニックリスクモデルは、類似した(主にヨーロッパ)祖先の参加者のデータを用いて開発された。
これにより、少数民族やアフリカ系アメリカ人のような混ざり合った個人に適用すると、リスク予測者の偏りが生じる可能性がある。
このバイアスに対処するために, 人口構造を基盤とする予測モデルを中心に, 多様な人口のデータを活用し, その表現における表現型関連情報から祖先を異にする新しいディープラーニングフレームワークを提案する。
祖先の矛盾した表現は、少数民族にまたがるリスク予測器を構築するのに使うことができる。
提案手法をアルツハイマー病遺伝子解析に応用した。
従来の線形リスク予測法や非線形リスク予測法と比較して,提案手法は少数民族,特に混成個体のリスク予測を大幅に改善する。
関連論文リスト
- Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Developing a Novel Holistic, Personalized Dementia Risk Prediction Model
via Integration of Machine Learning and Network Systems Biology Approaches [0.0]
提案手法は認知症リスク予測のための新しい全体論的アプローチを利用する。
環境汚染やライフスタイルの要因データをネットワークシステムに基づく遺伝データに組み込むのはこれが初めてである。
本モデルでは, 全身性認知症リスク予測を臨床応用に応用した。
論文 参考訳(メタデータ) (2023-10-04T02:47:29Z) - Predictive Multiplicity in Probabilistic Classification [25.111463701666864]
確率的分類における予測的乗数性を測定するための枠組みを提案する。
実世界のタスクにおける予測多重度の発生頻度と頻度を実証する。
その結果,予測多重度をより広範囲に報告する必要性が強調された。
論文 参考訳(メタデータ) (2022-06-02T16:25:29Z) - Mitigating multiple descents: A model-agnostic framework for risk
monotonization [84.6382406922369]
クロスバリデーションに基づくリスクモノトナイズのための一般的なフレームワークを開発する。
本稿では,データ駆動方式であるゼロステップとワンステップの2つの手法を提案する。
論文 参考訳(メタデータ) (2022-05-25T17:41:40Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Targeting Underrepresented Populations in Precision Medicine: A
Federated Transfer Learning Approach [7.467496975496821]
多様な人口と複数の医療機関の異種データを統合した双方向データ統合戦略を提案する。
提案手法は, 人口の予測精度と予測精度を向上し, 人口間のモデル性能のギャップを小さくすることを示す。
論文 参考訳(メタデータ) (2021-08-27T04:04:34Z) - Surrogate Assisted Semi-supervised Inference for High Dimensional Risk
Prediction [3.10560974227074]
高次元予測器を用いたリスクモデリングのためのSAS(Surrogate Assisted Semi-supervised- Learning)アプローチを開発しています。
SAS法が高次元作業モデルに起因する予測リスクに対して有効な推論を提供することを実証する。
論文 参考訳(メタデータ) (2021-05-04T03:08:51Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - A General Framework for Survival Analysis and Multi-State Modelling [70.31153478610229]
ニューラル常微分方程式を多状態生存モデル推定のためのフレキシブルで一般的な方法として用いる。
また,本モデルでは,サバイバルデータセット上での最先端性能を示すとともに,マルチステート環境での有効性を示す。
論文 参考訳(メタデータ) (2020-06-08T19:24:54Z) - Survival Cluster Analysis [93.50540270973927]
異なるリスクプロファイルを持つサブポピュレーションを特定するために、生存分析には未解決の必要性がある。
このニーズに対処するアプローチは、個々の成果のキャラクタリゼーションを改善する可能性が高い。
論文 参考訳(メタデータ) (2020-02-29T22:41:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。