論文の概要: Inferring genotype-phenotype maps using attention models
- arxiv url: http://arxiv.org/abs/2504.10388v1
- Date: Mon, 14 Apr 2025 16:32:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:48:44.508320
- Title: Inferring genotype-phenotype maps using attention models
- Title(参考訳): 注意モデルを用いた遺伝子型フェノタイプマップの推論
- Authors: Krishna Rijal, Caroline M. Holmes, Samantha Petti, Gautam Reddy, Michael M. Desai, Pankaj Mehta,
- Abstract要約: 遺伝子型から表現型を予測することは遺伝学における中心的な課題である。
機械学習の最近の進歩、特に注意に基づくモデルは、有望な代替手段を提供する。
ここでは、注意に基づくモデルを定量的遺伝学に適用する。
- 参考スコア(独自算出の注目度): 0.21990652930491852
- License:
- Abstract: Predicting phenotype from genotype is a central challenge in genetics. Traditional approaches in quantitative genetics typically analyze this problem using methods based on linear regression. These methods generally assume that the genetic architecture of complex traits can be parameterized in terms of an additive model, where the effects of loci are independent, plus (in some cases) pairwise epistatic interactions between loci. However, these models struggle to analyze more complex patterns of epistasis or subtle gene-environment interactions. Recent advances in machine learning, particularly attention-based models, offer a promising alternative. Initially developed for natural language processing, attention-based models excel at capturing context-dependent interactions and have shown exceptional performance in predicting protein structure and function. Here, we apply attention-based models to quantitative genetics. We analyze the performance of this attention-based approach in predicting phenotype from genotype using simulated data across a range of models with increasing epistatic complexity, and using experimental data from a recent quantitative trait locus mapping study in budding yeast. We find that our model demonstrates superior out-of-sample predictions in epistatic regimes compared to standard methods. We also explore a more general multi-environment attention-based model to jointly analyze genotype-phenotype maps across multiple environments and show that such architectures can be used for "transfer learning" - predicting phenotypes in novel environments with limited training data.
- Abstract(参考訳): 遺伝子型から表現型を予測することは遺伝学における中心的な課題である。
定量的遺伝学における伝統的なアプローチは、典型的には線形回帰に基づく手法を用いてこの問題を分析する。
これらの手法は一般的に、複雑な形質の遺伝的構造は、ロシの影響が独立である加法モデル、および(場合によっては)ロシ間のペアワイズなエピスタティック相互作用の観点からパラメータ化できると仮定する。
しかし、これらのモデルは、より複雑なエピスタシスのパターンや微妙な遺伝子-環境相互作用を分析するのに苦労する。
機械学習の最近の進歩、特に注意に基づくモデルは、有望な代替手段を提供する。
当初、自然言語処理のために開発されたアテンションベースのモデルは、コンテキスト依存的な相互作用を捉えるのに優れ、タンパク質の構造と機能を予測するのに例外的な性能を示した。
ここでは、注意に基づくモデルを定量的遺伝学に適用する。
本研究は, 遺伝子型から表現型を予測するための注意に基づく手法の性能解析であり, 上皮性複雑性の増大を伴うモデルの範囲のシミュレーションデータと, 出芽酵母における最近の量的形質軌跡マッピング研究による実験データを用いて解析する。
本モデルでは, 従来の手法と比較して, 静圧状態におけるサンプル外予測の精度が向上していることが判明した。
また,複数の環境にまたがるジェノタイプフェノタイプマップを共同で解析する,より汎用的なマルチ環境アテンションモデルも検討し,このようなアーキテクチャが,限られたトレーニングデータを持つ新しい環境における表現型を予測する「トランスファーラーニング」に利用できることを示す。
関連論文リスト
- G2PDiffusion: Cross-Species Genotype-to-Phenotype Prediction via Evolutionary Diffusion [108.94237816552024]
本稿では,DNAから形態像を生成する最初の遺伝子型対フェノタイプ拡散モデル(G2PDiffusion)を提案する。
本モデルは,1)保存および共進化パターンを識別するMSA検索エンジン,2)複雑なジェノタイプ-環境相互作用を効果的にモデル化する環境対応MSA条件エンコーダ,3)遺伝子型-フェノタイプ整合性を改善する適応型表現的アライメントモジュールを含む。
論文 参考訳(メタデータ) (2025-02-07T06:16:31Z) - Stacked ensemble\-based mutagenicity prediction model using multiple modalities with graph attention network [0.9736758288065405]
変異原性は、様々なネガティブな結果をもたらす遺伝子変異と関連しているため、懸念される。
本研究では,新しいアンサンブルに基づく変異原性予測モデルを提案する。
論文 参考訳(メタデータ) (2024-09-03T09:14:21Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Generalising sequence models for epigenome predictions with tissue and
assay embeddings [1.9999259391104391]
組織とアッセイの埋め込みを文脈的ゲノミクスネットワーク(CGN)に組み込むことにより,幅広い実験条件において強い相関性が得られることを示す。
本研究は, エピジェネティック・シークエンス・モデル・トレーニングにおける遺伝的変異の影響について, 幅広いエピジェネティック・プロファイルにまたがるアプローチの有効性を示し, 遺伝子変異がエピジェネティック・シークエンス・モデル・トレーニングに与える影響について考察した。
論文 参考訳(メタデータ) (2023-08-22T10:34:19Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Hypothesis Testing using Causal and Causal Variational Generative Models [0.0]
Causal GenとCausal Variational Genは、非パラメトリックな構造因果知識とディープラーニング機能近似を併用することができる。
我々は、意図的な(非ランダムな)トレーニングとテストデータの分割を用いて、これらのモデルが、類似の、しかし分布外のデータポイントよりも一般化できることを示します。
本手法は, 人工振り子データセット, 外傷手術用地上レベル落下データセットを用いて検証した。
論文 参考訳(メタデータ) (2022-10-20T13:46:15Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Mycorrhiza: Genotype Assignment usingPhylogenetic Networks [2.286041284499166]
遺伝子型代入問題に対する機械学習手法であるMycorrhizaを紹介する。
提案アルゴリズムは系統ネットワークを用いて,標本間の進化的関係を符号化する特徴を設計する。
Mycorrhizaは、大きな平均固定指数(FST)を持つデータセットやハーディ・ワインバーグ平衡からの偏差で特に顕著な利得を得る。
論文 参考訳(メタデータ) (2020-10-14T02:36:27Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。