論文の概要: Biology-informed neural networks learn nonlinear representations from omics data to improve genomic prediction and interpretability
- arxiv url: http://arxiv.org/abs/2510.14970v1
- Date: Thu, 16 Oct 2025 17:59:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:15.004339
- Title: Biology-informed neural networks learn nonlinear representations from omics data to improve genomic prediction and interpretability
- Title(参考訳): 生物学的インフォームドニューラルネットワークは、ゲノムデータから非線形表現を学習し、ゲノム予測と解釈性を改善する
- Authors: Katiana Kontolati, Rini Jasmine Gladstone, Ian Davis, Ethan Pickering,
- Abstract要約: 我々は、作物のゲノム予測(GP)と選抜(GS)のために、生物情報ニューラルネットワーク(BINN)を拡張した。
BINNは、経路レベルの誘導バイアスを符号化し、トレーニング中にのみマルチオミクスデータを活用することで制限を克服する。
BINNは、合成メタボロミクスベンチマークのための完全なドメイン知識により、従来のニューラルネットワークと比較して予測誤差を75%削減する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We extend biologically-informed neural networks (BINNs) for genomic prediction (GP) and selection (GS) in crops by integrating thousands of single-nucleotide polymorphisms (SNPs) with multi-omics measurements and prior biological knowledge. Traditional genotype-to-phenotype (G2P) models depend heavily on direct mappings that achieve only modest accuracy, forcing breeders to conduct large, costly field trials to maintain or marginally improve genetic gain. Models that incorporate intermediate molecular phenotypes such as gene expression can achieve higher predictive fit, but they remain impractical for GS since such data are unavailable at deployment or design time. BINNs overcome this limitation by encoding pathway-level inductive biases and leveraging multi-omics data only during training, while using genotype data alone during inference. Applied to maize gene-expression and multi-environment field-trial data, BINN improves rank-correlation accuracy by up to 56% within and across subpopulations under sparse-data conditions and nonlinearly identifies genes that GWAS/TWAS fail to uncover. With complete domain knowledge for a synthetic metabolomics benchmark, BINN reduces prediction error by 75% relative to conventional neural nets and correctly identifies the most important nonlinear pathway. Importantly, both cases show highly sensitive BINN latent variables correlate with the experimental quantities they represent, despite not being trained on them. This suggests BINNs learn biologically-relevant representations, nonlinear or linear, from genotype to phenotype. Together, BINNs establish a framework that leverages intermediate domain information to improve genomic prediction accuracy and reveal nonlinear biological relationships that can guide genomic selection, candidate gene selection, pathway enrichment, and gene-editing prioritization.
- Abstract(参考訳): 我々は、作物のゲノム予測(GP)と選抜(GS)のためのバイオインフォームドニューラルネットワーク(BINN)を拡張し、数千の単一ヌクレオチド多型(SNP)をマルチオミクス測定と先行生物学的知識を統合する。
従来のジェノタイプ・ツー・フェノタイプ(G2P)モデルは、わずかの精度しか達成しない直接的なマッピングに大きく依存しており、育種者は、遺伝的ゲインを維持するか、またはわずかに改善するために、大規模でコストのかかるフィールドトライアルを行わざるを得ない。
遺伝子発現などの中間分子表現型を組み込んだモデルは高い予測適合性が得られるが、これらのデータは配備時や設計時に利用できないため、GSにとって実用的ではない。
BINNは、経路レベルの誘導バイアスを符号化し、トレーニング中にのみマルチオミクスデータを活用し、推論中にのみジェノタイプデータを使用することで、この制限を克服する。
BINNは、遺伝子の発現と多環境の電顕データに応用し、スパースデータ条件下でのサブポピュレーション中のランク相関の精度を最大56%向上させ、GWAS/TWASが発見できない遺伝子を非線形に同定する。
BINNは、合成メタボロミクスベンチマークのための完全なドメイン知識により、従来のニューラルネットワークと比較して予測誤差を75%削減し、最も重要な非線形経路を正しく識別する。
両症例とも、BINN潜伏変数は、訓練を受けていないにもかかわらず、それらが表す実験量と相関している。
これはBINNが遺伝子型から表現型へ生物学的に関連性のある表現、非線形または線形の表現を学ぶことを示唆している。
BINNは、中間ドメイン情報を活用してゲノム予測精度を改善し、ゲノム選択、候補遺伝子選択、経路の富化、遺伝子編集の優先順位付けを導く非線形生物学的関係を明らかにする枠組みを確立する。
関連論文リスト
- AGP: A Novel Arabidopsis thaliana Genomics-Phenomics Dataset and its HyperGraph Baseline Benchmarking [43.90415454135298]
本研究では,シロイヌナズナの遺伝子発現プロファイルと表現型形質測定をリンクした解析データセットを提案する。
AGPは表現型予測や解釈可能なグラフ学習などのタスクをサポートする。
我々の知る限りでは、これはマルチモーダル遺伝子情報と異種形質または表現型データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2025-08-19T21:21:23Z) - GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - An end-to-end framework for gene expression classification by
integrating a background knowledge graph: application to cancer prognosis
prediction [1.5484595752241122]
我々は、一次データの分類モデルを構築するために、二次データを扱うエンドツーエンドフレームワークを提案した。
我々はこの枠組みを,遺伝子発現データと生物学的ネットワークを用いた癌予後予測に応用した。
論文 参考訳(メタデータ) (2023-06-29T11:20:47Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Debiased Graph Neural Networks with Agnostic Label Selection Bias [59.61301255860836]
既存のグラフニューラルネットワーク(GNN)のほとんどは、データの選択バイアスを考慮せずに提案されている。
本稿では,デコリレーションレギュレータを区別した新しいデバイアスドグラフニューラルネットワーク(DGNN)を提案する。
DGNNは既存のGNNを強化するフレキシブルなフレームワークである。
論文 参考訳(メタデータ) (2022-01-19T16:50:29Z) - A Cross-Level Information Transmission Network for Predicting Phenotype
from New Genotype: Application to Cancer Precision Medicine [37.442717660492384]
本稿では,CLEIT(Cross-Level Information Transmission Network)フレームワークを提案する。
ドメイン適応にインスパイアされたCLEITは、まずハイレベルドメインの潜在表現を学び、その後、接地木埋め込みとして利用する。
体細胞突然変異による抗がん剤感受性の予測におけるCLEITの有効性と性能の向上を示す。
論文 参考訳(メタデータ) (2020-10-09T22:01:00Z) - Handling highly correlated genes in prediction analysis of genomic
studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。
本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。
まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文 参考訳(メタデータ) (2020-07-05T22:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。