論文の概要: GoBERT: Gene Ontology Graph Informed BERT for Universal Gene Function Prediction
- arxiv url: http://arxiv.org/abs/2501.01930v1
- Date: Fri, 03 Jan 2025 18:02:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-06 15:11:14.582344
- Title: GoBERT: Gene Ontology Graph Informed BERT for Universal Gene Function Prediction
- Title(参考訳): GoBERT:ユニバーサル遺伝子関数予測のための遺伝子オントロジーグラフインフォームされたBERT
- Authors: Yuwei Miao, Yuzhi Guo, Hehuan Ma, Jingquan Yan, Feng Jiang, Rui Liao, Junzhou Huang,
- Abstract要約: BERT(GoBERT)を用いた遺伝子オントロジーグラフとアノテーションの探索により,遺伝子機能予測問題に取り組むことを提案する。
2つのプレトレインタスクは、関数の明示的および暗黙的な関係をキャプチャするために、GoBERTを共同で訓練するように設計されている。
GoBERTは、既知の機能アノテーションに基づいて、様々な遺伝子および遺伝子産物の新規機能を予測する能力を持っている。
- 参考スコア(独自算出の注目度): 33.42820754967865
- License:
- Abstract: Exploring the functions of genes and gene products is crucial to a wide range of fields, including medical research, evolutionary biology, and environmental science. However, discovering new functions largely relies on expensive and exhaustive wet lab experiments. Existing methods of automatic function annotation or prediction mainly focus on protein function prediction with sequence, 3D-structures or protein family information. In this study, we propose to tackle the gene function prediction problem by exploring Gene Ontology graph and annotation with BERT (GoBERT) to decipher the underlying relationships among gene functions. Our proposed novel function prediction task utilizes existing functions as inputs and generalizes the function prediction to gene and gene products. Specifically, two pre-train tasks are designed to jointly train GoBERT to capture both explicit and implicit relations of functions. Neighborhood prediction is a self-supervised multi-label classification task that captures the explicit function relations. Specified masking and recovering task helps GoBERT in finding implicit patterns among functions. The pre-trained GoBERT possess the ability to predict novel functions for various gene and gene products based on known functional annotations. Extensive experiments, biological case studies, and ablation studies are conducted to demonstrate the superiority of our proposed GoBERT.
- Abstract(参考訳): 遺伝子や遺伝子産物の機能の探索は、医学研究、進化生物学、環境科学など幅広い分野において重要である。
しかし、新しい機能の発見は、高価で徹底的なウェットラボ実験に大きく依存している。
既存の自動機能アノテーションや予測手法は主に、配列、3D構造、タンパク質ファミリー情報によるタンパク質機能予測に焦点を当てている。
本研究では、遺伝子オントロジーグラフとアノテーションをBERT(GoBERT)で探索し、遺伝子機能間の基盤となる関係を解明することで、遺伝子機能予測問題に取り組むことを提案する。
提案する関数予測タスクは,既存の関数を入力として利用し,遺伝子および遺伝子産物に対する関数予測を一般化する。
具体的には、2つのプレトレインタスクは、関数の明示的および暗黙的な関係をキャプチャするために、GoBERTを共同で訓練するように設計されている。
近隣の予測は、明示的な関数関係をキャプチャする自己教師付きマルチラベル分類タスクである。
特定のマスキングと回復タスクは、GoBERTが関数間の暗黙のパターンを見つけるのに役立つ。
事前訓練されたGoBERTは、既知の機能アノテーションに基づいて、様々な遺伝子および遺伝子産物の新規機能を予測する能力を有する。
提案するGoBERTの優位性を示すため, 大規模実験, 生物ケース研究, アブレーション研究を行った。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本研究では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデルを提案する。
このモデルは分子生物学の中心的なドグマに固執し、タンパク質のコード配列を正確に生成する。
また、特にプロモーター配列の即応的な生成を通じて、シーケンス最適化において大きな可能性を示している。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - FGBERT: Function-Driven Pre-trained Gene Language Model for Metagenomics [46.189419603576084]
FGBERTは、タンパク質に基づく遺伝子表現を文脈認識トークン化剤として利用する、新しいメダゲノミクス事前訓練モデルである。
これは、遺伝子、機能、細菌、環境レベルにまたがる4つのレベルでのメダゲノミクスデータセットに優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-24T13:13:17Z) - Graph-in-Graph Network for Automatic Gene Ontology Description
Generation [55.40404942182707]
GO項記述生成という新しい課題を提案する。
本課題は、3つのカテゴリのうちの1つに属するGO項の機能を記述する文を自動生成することを目的とする。
提案するネットワークでは,2層グラフを導入している。第1層はGO項のグラフであり,各ノードがグラフ(遺伝子グラフ)でもある。
論文 参考訳(メタデータ) (2022-06-10T18:17:17Z) - Gene Function Prediction with Gene Interaction Networks: A Context Graph
Kernel Approach [24.234645183601998]
そこで本研究では,焦点遺伝子に関連付けられた遺伝子相互作用ネットワークとして,遺伝子コンテキストグラフを用いた機能推定を提案する。
カーネルベースの機械学習フレームワークでは、コンテキストグラフで情報をキャプチャするコンテキストグラフカーネルを設計する。
論文 参考訳(メタデータ) (2022-04-22T02:54:01Z) - Feature extraction using Spectral Clustering for Gene Function
Prediction [0.4492444446637856]
本稿では,クラスタ分析と階層的マルチラベル分類を組み合わせたアノテーション問題に対する,シリコアプローチの新たなアプローチを提案する。
提案手法は、世界で最も支配的かつ生産的な作物であるゼア・メイズ(Zia mays)のケーススタディに適用される。
論文 参考訳(メタデータ) (2022-03-25T10:17:36Z) - Mining Functionally Related Genes with Semi-Supervised Learning [0.0]
我々は、豊富な機能セットを導入し、半教師付き学習アプローチとともにそれらを使用する。
正およびラベルなし例(LPU)による学習の枠組みは機能的関連遺伝子のマイニングに特に適していることが示されている。
論文 参考訳(メタデータ) (2020-11-05T20:34:09Z) - Handling highly correlated genes in prediction analysis of genomic
studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。
本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。
まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文 参考訳(メタデータ) (2020-07-05T22:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。