論文の概要: GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype
- arxiv url: http://arxiv.org/abs/2505.03853v1
- Date: Tue, 06 May 2025 03:35:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:35.873429
- Title: GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype
- Title(参考訳): GRAPE: コードと非コード生物型を用いた遺伝的摂動のための不均一グラフ表現学習
- Authors: Changxi Chi, Jun Xia, Jingbo Zhou, Jiabei Cheng, Chang Yu, Stan Z. Li,
- Abstract要約: 遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
- 参考スコア(独自算出の注目度): 51.58774936662233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting genetic perturbations enables the identification of potentially crucial genes prior to wet-lab experiments, significantly improving overall experimental efficiency. Since genes are the foundation of cellular life, building gene regulatory networks (GRN) is essential to understand and predict the effects of genetic perturbations. However, current methods fail to fully leverage gene-related information, and solely rely on simple evaluation metrics to construct coarse-grained GRN. More importantly, they ignore functional differences between biotypes, limiting the ability to capture potential gene interactions. In this work, we leverage pre-trained large language model and DNA sequence model to extract features from gene descriptions and DNA sequence data, respectively, which serve as the initialization for gene representations. Additionally, we introduce gene biotype information for the first time in genetic perturbation, simulating the distinct roles of genes with different biotypes in regulating cellular processes, while capturing implicit gene relationships through graph structure learning (GSL). We propose GRAPE, a heterogeneous graph neural network (HGNN) that leverages gene representations initialized with features from descriptions and sequences, models the distinct roles of genes with different biotypes, and dynamically refines the GRN through GSL. The results on publicly available datasets show that our method achieves state-of-the-art performance.
- Abstract(参考訳): 遺伝的摂動を予測することにより、ウェットラブ実験の前に潜在的に重要な遺伝子の同定が可能となり、総合的な実験効率が大幅に向上する。
遺伝子は細胞生活の基礎であるため、遺伝子調節ネットワーク(GRN)の構築は遺伝子摂動の影響を理解し予測するために不可欠である。
しかし、現在の手法では遺伝子関連情報を十分に活用することができず、粗い粒度のGRNを構築するための単純な評価基準にのみ依存している。
さらに重要なのは、生物種間の機能的差異を無視し、潜在的な遺伝子相互作用を捉える能力を制限することである。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述とDNAシークエンスデータから特徴を抽出し,遺伝子発現の初期化に役立てる。
さらに,細胞プロセスの制御において異なる生物型を持つ遺伝子の異なる役割をシミュレートするとともに,グラフ構造学習(GSL)を通して暗黙的な遺伝子関係を捉えることで,遺伝子摂動において初めて遺伝子バイオタイプ情報を導入する。
GRAPE(ヘテロジニアスグラフニューラルネットワーク、HGNN)は、記述や配列の特徴を初期化した遺伝子表現を活用し、異なるバイオタイプを持つ遺伝子の異なる役割をモデル化し、GRNをGSLを介して動的に洗練する。
公開データセットの結果から,本手法が最先端の性能を達成できることが示唆された。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - GeneQuery: A General QA-based Framework for Spatial Gene Expression Predictions from Histology Images [41.732831871866516]
全スライディングヘマトキシリンとエオシン染色組織像は容易にアクセスでき、顕微鏡レベルで組織構造と組成を詳細に調べることができる。
近年の進歩は、これらの組織像を利用して、空間的に解決された遺伝子発現プロファイルを予測している。
GeneQueryは、この遺伝子発現予測タスクを質問応答(QA)方式で解決し、より汎用性と柔軟性を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-11-27T14:33:13Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - MuSe-GNN: Learning Unified Gene Representation From Multimodal
Biological Graph Data [22.938437500266847]
マルチモーダル類似性学習グラフニューラルネットワークという新しいモデルを提案する。
マルチモーダル機械学習とディープグラフニューラルネットワークを組み合わせて、単一セルシークエンシングと空間転写データから遺伝子発現を学習する。
本モデルでは, 遺伝子機能, 組織機能, 疾患, 種進化の解析のために, 統合された遺伝子表現を効率よく生成する。
論文 参考訳(メタデータ) (2023-09-29T13:33:53Z) - Gene Function Prediction with Gene Interaction Networks: A Context Graph
Kernel Approach [24.234645183601998]
そこで本研究では,焦点遺伝子に関連付けられた遺伝子相互作用ネットワークとして,遺伝子コンテキストグラフを用いた機能推定を提案する。
カーネルベースの機械学習フレームワークでは、コンテキストグラフで情報をキャプチャするコンテキストグラフカーネルを設計する。
論文 参考訳(メタデータ) (2022-04-22T02:54:01Z) - VEGN: Variant Effect Prediction with Graph Neural Networks [19.59965282985234]
本稿では,遺伝子と変異を持つ異種グラフ上で動作するグラフニューラルネットワーク(GNN)を用いて,変異効果予測をモデル化したVEGNを提案する。
このグラフは、変異体を遺伝子に割り当て、遺伝子-遺伝子相互作用ネットワークに遺伝子を接続することによって作成される。
VeGNは既存の最先端モデルの性能を改善する。
論文 参考訳(メタデータ) (2021-06-25T13:51:46Z) - SimpleChrome: Encoding of Combinatorial Effects for Predicting Gene
Expression [8.326669256957352]
遺伝子のヒストン修飾表現を学習するディープラーニングモデルであるSimpleChromeを紹介します。
このモデルから得られた特徴により、遺伝子間相互作用の潜在効果と標的遺伝子の発現に対する直接遺伝子調節をよりよく理解することができます。
論文 参考訳(メタデータ) (2020-12-15T23:30:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。