論文の概要: GLaDiGAtor: Language-Model-Augmented Multi-Relation Graph Learning for Predicting Disease-Gene Associations
- arxiv url: http://arxiv.org/abs/2602.18769v1
- Date: Sat, 21 Feb 2026 09:26:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.305967
- Title: GLaDiGAtor: Language-Model-Augmented Multi-Relation Graph Learning for Predicting Disease-Gene Associations
- Title(参考訳): GLaDigator: 言語モデルの拡張型マルチリレーショナルグラフ学習による疾患遺伝子関連性の予測
- Authors: Osman Onur Kuzucu, Tunca Doğan,
- Abstract要約: 疾患遺伝子関連を理解することは、疾患のメカニズムを悪化させ、診断と治療の進歩に不可欠である。
既存のモデルにおける制約に対処するため,病因関連予測のためのエンコーダデコーダアーキテクチャを備えた新しいGNNフレームワークであるGLaDiGAtorを提案する。
GLaDiGAtorは、キュレートされたデータベースから遺伝子・遺伝子・疾患・疾患・疾患・遺伝子・疾患の相互作用を統合した異種生物学的グラフを構築する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding disease-gene associations is essential for unravelling disease mechanisms and advancing diagnostics and therapeutics. Traditional approaches based on manual curation and literature review are labour-intensive and not scalable, prompting the use of machine learning on large biomedical data. In particular, graph neural networks (GNNs) have shown promise for modelling complex biological relationships. To address limitations in existing models, we propose GLaDiGAtor (Graph Learning-bAsed DIsease-Gene AssociaTiOn pRediction), a novel GNN framework with an encoder-decoder architecture for disease-gene association prediction. GLaDiGAtor constructs a heterogeneous biological graph integrating gene-gene, disease-disease, and gene-disease interactions from curated databases, and enriches each node with contextual features from well-known language models (ProtT5 for protein sequences and BioBERT for disease text). In evaluations, our model achieves superior predictive accuracy and generalisation, outperforming 14 existing methods. Literature-supported case studies confirm the biological relevance of high-confidence novel predictions, highlighting GLaDiGAtor's potential to discover candidate disease genes. These results underscore the power of graph convolutional networks in biomedical informatics and may ultimately facilitate drug discovery by revealing new gene-disease links. The source code and processed datasets are publicly available at https://github.com/HUBioDataLab/GLaDiGAtor.
- Abstract(参考訳): 疾患遺伝子関連を理解することは、疾患のメカニズムを悪化させ、診断と治療の進歩に不可欠である。
手作業によるキュレーションと文献のレビューに基づく従来のアプローチは、労働集約的であり、スケーラブルではない。
特に、グラフニューラルネットワーク(GNN)は複雑な生物学的関係をモデル化することを約束している。
本稿では,GLaDiGAtor (Graph Learning-bAsed DIsease-Gene AssociaTiOn pRediction)を提案する。
GLaDiGAtorは、キュレートされたデータベースから遺伝子、疾患、疾患、および遺伝子発現の相互作用を統合した異種生物グラフを構築し、よく知られた言語モデル(タンパク質配列のProtT5と疾患テキストのBioBERT)のコンテキスト的特徴を各ノードに強化する。
評価において,本モデルは予測精度と一般化に優れ,14の既存手法よりも優れていた。
文献によるケーススタディは、GLaDiGAtorの潜在的な疾患遺伝子発見の可能性を強調し、高信頼の新規予測の生物学的関連性を確認している。
これらの結果は、バイオメディカル情報学におけるグラフ畳み込みネットワークの力を強調し、最終的には新しい遺伝子消失リンクを明らかにすることで薬物発見を促進する可能性がある。
ソースコードと処理されたデータセットはhttps://github.com/HUBioDataLab/GLaDiGAtor.comで公開されている。
関連論文リスト
- engGNN: A Dual-Graph Neural Network for Omics-Based Disease Classification and Feature Selection [5.54797146496798]
グラフニューラルネットワーク(GNN)は、機能関係をグラフとしてエンコーディングすることで、事前知識を統合するための有望な手段を提供する。
本稿では,外部生物ネットワークとデータ駆動型生成グラフを併用したデュアルグラフフレームワークである,外部で生成したグラフニューラルネットワーク(engGNN)を提案する。
engGNNは一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2026-01-20T23:18:56Z) - E-ABIN: an Explainable module for Anomaly detection in BIological Networks [1.7999333451993955]
E-ABINは、生体ネットワークにおける異常検出のための汎用的で説明可能なフレームワークである。
従来の機械学習とグラフベースのディープラーニング技術を組み合わせた、統一されたユーザフレンドリなプラットフォームだ。
膀胱癌とコリアック病の症例研究を通じてE-ABINの有用性を実証した。
論文 参考訳(メタデータ) (2025-06-25T08:25:17Z) - GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Applying BioBERT to Extract Germline Gene-Disease Associations for Building a Knowledge Graph from the Biomedical Literature [0.0]
本稿では,ジェムリン遺伝子と疾患を結合する知識グラフ構築手法SimpleGermKGを提案する。
遺伝子および疾患の抽出には、バイオメディカルコーパス上でトレーニング済みのBERTモデルであるBioBERTを用いる。
記事,遺伝子,疾患間の意味的関連性について,部分的関係性アプローチを実装した。
知識グラフには297の遺伝子、130の疾患、46,747のトリプルが含まれている。
論文 参考訳(メタデータ) (2023-09-11T18:05:12Z) - Knowledge Graph Completion based on Tensor Decomposition for Disease
Gene Prediction [2.838553480267889]
疾患や遺伝子を中心とした生物学的知識グラフを構築し,疾患発生予測のためのエンドツーエンドの知識グラフ補完モデルを構築した。
KDGeneは、実体の埋め込みとテンソル分解との関係の間の相互作用モジュールを導入し、生物学的知識における情報相互作用を効果的に強化する。
論文 参考訳(メタデータ) (2023-02-18T13:57:44Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。