論文の概要: High-dimensional multi-trait GWAS by reverse prediction of genotypes
- arxiv url: http://arxiv.org/abs/2111.00108v1
- Date: Fri, 29 Oct 2021 22:34:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-02 18:03:53.132964
- Title: High-dimensional multi-trait GWAS by reverse prediction of genotypes
- Title(参考訳): 遺伝子型逆予測による高次元多形質gwa
- Authors: Muhammad Ammar Malik, Adriaan-Alexander Ludl, Tom Michoel
- Abstract要約: 逆回帰は、高次元設定でマルチトレイGWASを実行するための有望なアプローチである。
マルチトランジットGWASにおける逆回帰のための異なる機械学習手法を解析した。
モデル特徴係数は変異体と個々の形質の関連性の強さと相関し,真のトランス-eQTL標的遺伝子を予測した。
- 参考スコア(独自算出の注目度): 3.441021278275805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-trait genome-wide association studies (GWAS) use multi-variate
statistical methods to identify associations between genetic variants and
multiple correlated traits simultaneously, and have higher statistical power
than independent univariate analysis of traits. Reverse regression, where
genotypes of genetic variants are regressed on multiple traits simultaneously,
has emerged as a promising approach to perform multi-trait GWAS in
high-dimensional settings where the number of traits exceeds the number of
samples. We extended this approach and analyzed different machine learning
methods (ridge regression, random forests and support vector machines)for
reverse regression in multi-trait GWAS, using genotypes, gene expression data
and ground-truth transcriptional regulatory networks from the DREAM5 SysGen
Challenge and from a cross between two yeast strains to evaluate methods. We
found that genotype prediction performance, in terms of root mean squared error
(RMSE), allowed to distinguish between genomic regions with high and low
transcriptional activity. Moreover, model feature coefficients correlated with
the strength of association between variants and individual traits, and were
predictive of true trans-eQTL target genes, with complementary findings across
methods.
- Abstract(参考訳): 多形質ゲノムワイド・アソシエーション(GWAS)研究は、多変量統計法を用いて、遺伝的変異と複数の相関形質の関連を同時に同定し、形質の独立な単変量解析よりも高い統計力を有する。
遺伝子変異の遺伝子型が複数の形質に同時に回帰するリバースレグレッションは、多形質gwaをサンプル数を超える高次元環境で実行するための有望なアプローチとして登場した。
我々は,DREAM5 SysGen Challengeからの遺伝子型,遺伝子発現データ,接地構造転写制御ネットワーク,および2つの酵母株間の交叉を用いて,異なる機械学習手法(尾根回帰,ランダムフォレスト,サポートベクターマシン)を用いて,GWASの逆回帰を解析し,評価を行った。
その結果、遺伝子型予測性能は、ルート平均二乗誤差(RMSE)で高い転写活性と低い転写活性を持つゲノム領域を区別できることがわかった。
さらに, モデル特徴係数は変種と個々の形質の関連性の強さと相関し, 真のeQTL標的遺伝子を予測し, 相補的な解析を行った。
関連論文リスト
- Weighted Diversified Sampling for Efficient Data-Driven Single-Cell Gene-Gene Interaction Discovery [56.622854875204645]
本稿では,遺伝子・遺伝子相互作用の探索に先進的なトランスフォーマーモデルを活用する,データ駆動型計算ツールを活用した革新的なアプローチを提案する。
新たな重み付き多様化サンプリングアルゴリズムは、データセットのたった2パスで、各データサンプルの多様性スコアを算出する。
論文 参考訳(メタデータ) (2024-10-21T03:35:23Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - Multiple Augmented Reduced Rank Regression for Pan-Cancer Analysis [0.0]
フレキシブルな行列回帰および分解法である多重強化階数回帰(maRRR)を提案する。
我々は、ランダム行列理論によって動機付けられた構造化された核ノルムの目的を考える。
われわれはTGAの複数の癌型(すなわち膵臓)の遺伝子発現データにmaRRRを適用した。
論文 参考訳(メタデータ) (2023-08-30T21:40:58Z) - Genetic heterogeneity analysis using genetic algorithm and network
science [2.6166087473624318]
ゲノムワイド・アソシエーション(GWAS)は、疾患に感受性のある遺伝的変数を同定することができる。
遺伝的効果に絡み合った遺伝的変数は、しばしば低い効果サイズを示す。
本稿では,FCSNet(Feature Co-Selection Network)という,GWASのための新しい特徴選択機構を提案する。
論文 参考訳(メタデータ) (2023-08-12T01:28:26Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome [62.997667081978825]
我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。
私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
論文 参考訳(メタデータ) (2020-08-01T10:36:27Z) - Handling highly correlated genes in prediction analysis of genomic
studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。
本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。
まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文 参考訳(メタデータ) (2020-07-05T22:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。