Fugu-MT 論文翻訳(概要): rfPhen2Gen: A machine learning based association study of brain imaging phenotypes to genotypes

論文の概要: rfPhen2Gen: A machine learning based association study of brain imaging phenotypes to genotypes

arxiv url: http://arxiv.org/abs/2204.00067v1
Date: Thu, 31 Mar 2022 20:15:22 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-04 15:19:33.637539
Title: rfPhen2Gen: A machine learning based association study of brain imaging phenotypes to genotypes
Title（参考訳）: rfphen2gen:脳画像表現型と遺伝子型に関する機械学習による研究
Authors: Muhammad Ammar Malik, Alexander S. Lundervold and Tom Michoel
Abstract要約: 56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
参考スコア（独自算出の注目度）: 71.1144397510333
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Imaging genetic studies aim to find associations between genetic variants and imaging quantitative traits. Traditional genome-wide association studies (GWAS) are based on univariate statistical tests, but when multiple traits are analyzed together they suffer from a multiple-testing problem and from not taking into account correlations among the traits. An alternative approach to multi-trait GWAS is to reverse the functional relation between genotypes and traits, by fitting a multivariate regression model to predict genotypes from multiple traits simultaneously. However, current reverse genotype prediction approaches are mostly based on linear models. Here, we evaluated random forest regression (RFR) as a method to predict SNPs from imaging QTs and identify biologically relevant associations. We learned machine learning models to predict 518,484 SNPs using 56 brain imaging QTs. We observed that genotype regression error is a better indicator of permutation p-value significance than genotype classification accuracy. SNPs within the known Alzheimer disease (AD) risk gene APOE had lowest RMSE for lasso and random forest, but not ridge regression. Moreover, random forests identified additional SNPs that were not prioritized by the linear models but are known to be associated with brain-related disorders. Feature selection identified well-known brain regions associated with AD,like the hippocampus and amygdala, as important predictors of the most significant SNPs. In summary, our results indicate that non-linear methods like random forests may offer additional insights into phenotype-genotype associations compared to traditional linear multi-variate GWAS methods.
Abstract（参考訳）: イメージング遺伝研究は、遺伝的変異と定量的特徴の関連を見つけることを目的としている。従来のゲノムワイド・アソシエーション研究(GWAS)は単変量統計検査に基づいているが、複数の形質が一緒に分析されると、多重テストの問題に悩まされ、特徴間の相関を考慮しない。多形質gwasの別のアプローチは、多変量回帰モデルを適用して複数の形質から同時に遺伝子型を予測することによって、遺伝子型と形質の間の機能的関係を逆転させることである。しかし、現在のリバースジェノタイプ予測アプローチは主に線形モデルに基づいている。そこで我々は,ランダム森林回帰(RFR)を画像QTからSNPを予測し,生物学的関連性を見極める方法として評価した。 56個の脳画像QTを用いて518,484個のSNPを予測する機械学習モデルを学習した。遺伝子型回帰誤差は遺伝子型分類精度よりもp値の置換の指標として優れている。アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラッソやランダムな森林ではRMSEが低かったが、隆起性は認められなかった。さらに、ランダム・フォレストは線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを同定した。特徴選択は、海馬や扁桃体のようなADに関連するよく知られた脳領域を、最も重要なSNPの重要な予測因子として同定した。以上の結果から,無作為林のような非線形手法は,従来の線形多変量GWAS法と比較して,表現型・遺伝子型関連性にさらなる洞察を与える可能性が示唆された。

関連論文リスト

GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文参考訳（メタデータ） (2025-05-06T03:35:24Z)
G2PDiffusion: Cross-Species Genotype-to-Phenotype Prediction via Evolutionary Diffusion [108.94237816552024]
本稿では,DNAから形態像を生成する最初の遺伝子型対フェノタイプ拡散モデル(G2PDiffusion)を提案する。本モデルは,1)保存および共進化パターンを識別するMSA検索エンジン,2)複雑なジェノタイプ-環境相互作用を効果的にモデル化する環境対応MSA条件エンコーダ,3)遺伝子型-フェノタイプ整合性を改善する適応型表現的アライメントモジュールを含む。
論文参考訳（メタデータ） (2025-02-07T06:16:31Z)
Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文参考訳（メタデータ） (2025-01-30T23:03:03Z)
Interpreting artificial neural networks to detect genome-wide association signals for complex traits [0.0]
複雑な疾患の遺伝的アーキテクチャを調べることは、遺伝的および環境要因の高度にポリジェニックでインタラクティブな景観のために困難である。我々は、シミュレーションと実際のジェノタイプ/フェノタイプデータセットの両方を用いて、複雑な特性を予測するために、人工ニューラルネットワークを訓練した。
論文参考訳（メタデータ） (2024-07-26T15:20:42Z)
Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。 BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。 BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文参考訳（メタデータ） (2024-06-05T06:42:27Z)
VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文参考訳（メタデータ） (2024-05-13T20:15:03Z)
Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文参考訳（メタデータ） (2024-04-26T16:39:50Z)
A Comparative Analysis of Gene Expression Profiling by Statistical and Machine Learning Approaches [1.8954222800767324]
がん検体を分類する機械学習モデルの生物学的および方法論的限界について論じる。遺伝子ランキングはこれらのモデルに適応した説明可能性法から得られる。ブラックボックスニューラルネットワークによって学習された情報は、微分表現の概念と関連している。
論文参考訳（メタデータ） (2024-02-01T18:17:36Z)
Predicting loss-of-function impact of genetic mutations: a machine learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文参考訳（メタデータ） (2024-01-26T19:27:38Z)
Unsupervised ensemble-based phenotyping helps enhance the discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文参考訳（メタデータ） (2023-01-07T18:36:44Z)
High-dimensional multi-trait GWAS by reverse prediction of genotypes [3.441021278275805]
逆回帰は、高次元設定でマルチトレイGWASを実行するための有望なアプローチである。マルチトランジットGWASにおける逆回帰のための異なる機械学習手法を解析した。モデル特徴係数は変異体と個々の形質の関連性の強さと相関し,真のトランス-eQTL標的遺伝子を予測した。
論文参考訳（メタデータ） (2021-10-29T22:34:35Z)
Expectile Neural Networks for Genetic Data Analysis of Complex Diseases [3.0088453915399747]
本研究では、複雑な疾患の遺伝子データ解析のための予測型ニューラルネットワーク(ENN)法を開発した。期待回帰と同様に、ERNは遺伝子変異と疾患の表現型との関係を包括的に把握する。提案手法は,遺伝子変異と疾患表現型との間に複雑な関係がある場合,既存の予測回帰よりも優れていた。
論文参考訳（メタデータ） (2020-10-26T21:07:40Z)
Two-step penalised logistic regression for multi-omic data with an application to cardiometabolic syndrome [62.997667081978825]
我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
論文参考訳（メタデータ） (2020-08-01T10:36:27Z)
Handling highly correlated genes in prediction analysis of genomic studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文参考訳（メタデータ） (2020-07-05T22:14:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。