論文の概要: A Linear-Transformer Hybrid for SNP-Based Genotype-to-Phenotype Prediction in Grapevine
- arxiv url: http://arxiv.org/abs/2605.06762v1
- Date: Thu, 07 May 2026 17:32:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.519942
- Title: A Linear-Transformer Hybrid for SNP-Based Genotype-to-Phenotype Prediction in Grapevine
- Title(参考訳): グラペビンのSNPに基づく遺伝子型間予測のための線形変換器ハイブリッド
- Authors: Yibin Wang, Murukarthick Jayakodi, Silvas Kirubakaran, Ambika Chandra, Azlan Zahid,
- Abstract要約: リニア・トランスフォーマーアプローチは、加法的遺伝的分散効果とトランスフォーマーに基づく非線形相互作用を統合する。
LiT-G2Pはベースラインモデルと比較して予測性能を一貫して改善する。
トリプルホーム密度では、LiT-G2Pは全体的なG2P性能でも最高である。
- 参考スコア(独自算出の注目度): 1.4764419660137327
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robust genotype-to-phenotype (G2P) prediction is essential for accelerating breeding decisions and genetic gain. However, it remains challenging to measure complex traits under variable field conditions and across years. In this study, we propose a linear-Transformer approach, LiT-G2P (Linear-Transformer Genotype-to-Phenotype), an automated predictive framework that integrates additive genetic variance effects with Transformer-based nonlinear interactions using genome-wide single-nucleotide polymorphisms (SNPs) data. We evaluated LiT-G2P on a panel of diverse grape accessions, genotyped with SNP markers and measured for phenotypes across two consecutive years. Target phenotypic traits include leaf hair density and trichome density of grapevines. Across both single-year and cross-year testing scenarios, LiT-G2P consistently improves prediction performance compared with baseline models. For hair density, LiT-G2P achieves the lowest error in both single-year and cross-year evaluations, with RMSEs of 0.469 and 0.454, respectively, while maintaining strong tolerance accuracies of 79.2% and 74.6%, respectively. For trichome density, LiT-G2P also presents the best overall G2P performance. In addition, we extract model-prioritized SNPs from attention weights and apply genotype-stratified analysis to provide interpretable candidate marker for downstream validation. These results demonstrate that integrating stable additive effects with learned interaction patterns can enhance cross-year robustness and support practical SNP-based predictive modeling for genomic selection.
- Abstract(参考訳): ロバスト・ジェノタイプ・ツー・フェノタイプ(G2P)の予測は、繁殖決定と遺伝的ゲインの促進に不可欠である。
しかし、様々なフィールド条件と数年にわたる複雑な特性を測定することは依然として困難である。
本研究では,ゲノムワイド単一ヌクレオチド多型(SNP)データを用いたトランスフォーマーに基づく非線形相互作用に付加的な遺伝的分散効果を統合する自動予測フレームワークLiT-G2P(Linear-Transformer Genotype-to-Phenotype)を提案する。
SNPマーカーで遺伝子型解析し,2年連続で表現型を測定したところ,多種多様なブドウの接種パネル上でLiT-G2Pを評価した。
標的形質の特徴は、葉毛密度とブドウのトリホーム密度である。
LiT-G2Pは単年テストとクロス年テストの両方のシナリオで、ベースラインモデルと比較して予測性能を一貫して改善している。
毛髪密度について、LiT-G2Pは、それぞれ0.469と0.454のRMSEと、79.2%と74.6%の強い許容精度を維持しながら、単年と交差年の双方で最も低い誤差を達成している。
トリプルホーム密度では、LiT-G2Pは全体的なG2P性能でも最高である。
さらに、注意重みからモデル優先SNPを抽出し、遺伝子型階層化分析を適用し、下流検証のための解釈可能な候補マーカーを提供する。
これらの結果から, 安定な添加効果を学習相互作用パターンと組み合わせることで, 年次ロバスト性を高め, 実用的なSNPに基づくゲノム選択予測モデルを支援することが示唆された。
関連論文リスト
- EFGPP: Exploratory framework for genotype-phenotype prediction [0.0]
EFSTPは、遺伝子型からフェノタイプへの予測のために、複数のタイプのデータを生成し、ランク付けし、組み合わせるためのフレームワークである。
733人の英国バイオバンクデータを用いた片頭痛予測にESFTPを適用した。
論文 参考訳(メタデータ) (2026-05-02T12:42:40Z) - GenoBERT: A Language Model for Accurate Genotype Imputation [23.45811349566905]
GenoBERT (Genotype Bidirectional Representations from Transformers) は、位相付きジェノタイプをトークン化する参照レスフレームワークである。
GenoBERTは4つのベースライン法と比較して全体的な精度が最も高い。
論文 参考訳(メタデータ) (2026-03-31T04:16:55Z) - SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion [6.660968772645983]
SNPgenは、表現型制御された合成遺伝子型を生成するための条件付き潜伏拡散フレームワークである。
英国バイオバンクの個人を4つの複雑な疾患に分けて評価した。
論文 参考訳(メタデータ) (2026-03-11T15:23:37Z) - GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - G2PDiffusion: Cross-Species Genotype-to-Phenotype Prediction via Evolutionary Diffusion [108.94237816552024]
本稿では,DNAから形態像を生成する最初の遺伝子型対フェノタイプ拡散モデル(G2PDiffusion)を提案する。
本モデルは,1)保存および共進化パターンを識別するMSA検索エンジン,2)複雑なジェノタイプ-環境相互作用を効果的にモデル化する環境対応MSA条件エンコーダ,3)遺伝子型-フェノタイプ整合性を改善する適応型表現的アライメントモジュールを含む。
論文 参考訳(メタデータ) (2025-02-07T06:16:31Z) - CSGDN: Contrastive Signed Graph Diffusion Network for Predicting Crop Gene-phenotype Associations [6.5678927417916455]
我々は、より少ないトレーニングサンプルでロバストなノード表現を学習し、より高いリンク予測精度を実現するために、コントラスト符号付きグラフ拡散ネットワーク(CSGDN)を提案する。
Gossypium hirsutum, Brassica napus, Triticum turgidumの3つの作物データセット上でCSGDNの有効性を検証する実験を行った。
論文 参考訳(メタデータ) (2024-10-10T01:01:10Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。