論文の概要: GenePheno: Interpretable Gene Knockout-Induced Phenotype Abnormality Prediction from Gene Sequences
- arxiv url: http://arxiv.org/abs/2511.09512v1
- Date: Thu, 13 Nov 2025 01:59:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.603889
- Title: GenePheno: Interpretable Gene Knockout-Induced Phenotype Abnormality Prediction from Gene Sequences
- Title(参考訳): GenePheno:遺伝子シークエンスからの遺伝子ノックアウトによるフェノタイプ異常の予測
- Authors: Jingquan Yan, Yuwei Miao, Lei Yu, Yuzhi Guo, Xue Xiao, Lin Xu, Junzhou Huang,
- Abstract要約: GenePhenoは、遺伝子配列からのノックアウト誘発表現異常を予測する、最初の解釈可能なマルチラベル予測フレームワークである。
GenePhenoは、異種間相関を捉え、生物学的一貫性を強制する排他的規則化によって補完する、対照的なマルチラベル学習の目的を採用している。
GenePhenoは最先端の遺伝子中心Fmaxと表現型中心AUCを実現し、ケーススタディでは遺伝子機能機構を明らかにする能力を示している。
- 参考スコア(独自算出の注目度): 23.32906953921921
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Exploring how genetic sequences shape phenotypes is a fundamental challenge in biology and a key step toward scalable, hypothesis-driven experimentation. The task is complicated by the large modality gap between sequences and phenotypes, as well as the pleiotropic nature of gene-phenotype relationships. Existing sequence-based efforts focus on the degree to which variants of specific genes alter a limited set of phenotypes, while general gene knockout induced phenotype abnormality prediction methods heavily rely on curated genetic information as inputs, which limits scalability and generalizability. As a result, the task of broadly predicting the presence of multiple phenotype abnormalities under gene knockout directly from gene sequences remains underexplored. We introduce GenePheno, the first interpretable multi-label prediction framework that predicts knockout induced phenotypic abnormalities from gene sequences. GenePheno employs a contrastive multi-label learning objective that captures inter-phenotype correlations, complemented by an exclusive regularization that enforces biological consistency. It further incorporates a gene function bottleneck layer, offering human interpretable concepts that reflect functional mechanisms behind phenotype formation. To support progress in this area, we curate four datasets with canonical gene sequences as input and multi-label phenotypic abnormalities induced by gene knockouts as targets. Across these datasets, GenePheno achieves state-of-the-art gene-centric Fmax and phenotype-centric AUC, and case studies demonstrate its ability to reveal gene functional mechanisms.
- Abstract(参考訳): 遺伝子配列が表現型をどのように形成するかを探索することは、生物学における基本的な課題であり、スケーラブルで仮説駆動的な実験への重要なステップである。
この課題は、配列と表現型の間の大きなモダリティギャップ、および遺伝子・フェノタイプ関係の多角的性質によって複雑である。
既存の配列に基づく取り組みは、特定の遺伝子の変異が特定の表現型を限定的に変化させる程度に重点を置いている一方、一般的な遺伝子ノックアウトによって誘導される表現型異常予測法は、拡張性と一般化性を制限する入力としてのキュレートされた遺伝情報に大きく依存している。
その結果、遺伝子ノックアウトによる複数の表現型異常の存在を広範囲に予測するタスクは、未解明のままである。
GenePhenoは、遺伝子配列からのノックアウト誘発表現異常を予測する、最初の解釈可能なマルチラベル予測フレームワークである。
GenePhenoは、異種間相関を捉え、生物学的一貫性を強制する排他的正則化によって補完する、対照的なマルチラベル学習の目的を採用している。
さらに遺伝子機能のボトルネック層を組み込み、表現型形成の背後にある機能的メカニズムを反映する人間の解釈可能な概念を提供する。
この領域の進歩を支援するために,遺伝子ノックアウトによって引き起こされる入力および多ラベル表現異常を標的として,標準遺伝子配列を持つ4つのデータセットをキュレートした。
これらのデータセット全体で、GenePhenoは最先端の遺伝子中心Fmaxと表現型中心AUCを達成し、ケーススタディは遺伝子機能機構を明らかにする能力を示している。
関連論文リスト
- GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - G2PDiffusion: Cross-Species Genotype-to-Phenotype Prediction via Evolutionary Diffusion [108.94237816552024]
本稿では,DNAから形態像を生成する最初の遺伝子型対フェノタイプ拡散モデル(G2PDiffusion)を提案する。
本モデルは,1)保存および共進化パターンを識別するMSA検索エンジン,2)複雑なジェノタイプ-環境相互作用を効果的にモデル化する環境対応MSA条件エンコーダ,3)遺伝子型-フェノタイプ整合性を改善する適応型表現的アライメントモジュールを含む。
論文 参考訳(メタデータ) (2025-02-07T06:16:31Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Handling highly correlated genes in prediction analysis of genomic
studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。
本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。
まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文 参考訳(メタデータ) (2020-07-05T22:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。