論文の概要: VitaGraph: Building a Knowledge Graph for Biologically Relevant Learning Tasks
- arxiv url: http://arxiv.org/abs/2505.11185v1
- Date: Fri, 16 May 2025 12:43:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:14.972106
- Title: VitaGraph: Building a Knowledge Graph for Biologically Relevant Learning Tasks
- Title(参考訳): VitaGraph: 生物学的に関連する学習課題のための知識グラフの構築
- Authors: Francesco Madeddu, Lucia Testa, Gianluca De Carlo, Michele Pieroni, Andrea Mastropietro, Aris Anagnostopoulos, Paolo Tieri, Sergio Barbarossa,
- Abstract要約: 複数の公開データセットの統合と精錬によって構築された包括的生物学的知識グラフを提案する。
得られたリソースは、計算生物学と精密医療の研究を進めるための最先端のプラットフォームとして機能する、一貫性があり信頼性の高い生物学的知識グラフである。
- 参考スコア(独自算出の注目度): 8.962235896860294
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The intrinsic complexity of human biology presents ongoing challenges to scientific understanding. Researchers collaborate across disciplines to expand our knowledge of the biological interactions that define human life. AI methodologies have emerged as powerful tools across scientific domains, particularly in computational biology, where graph data structures effectively model biological entities such as protein-protein interaction (PPI) networks and gene functional networks. Those networks are used as datasets for paramount network medicine tasks, such as gene-disease association prediction, drug repurposing, and polypharmacy side effect studies. Reliable predictions from machine learning models require high-quality foundational data. In this work, we present a comprehensive multi-purpose biological knowledge graph constructed by integrating and refining multiple publicly available datasets. Building upon the Drug Repurposing Knowledge Graph (DRKG), we define a pipeline tasked with a) cleaning inconsistencies and redundancies present in DRKG, b) coalescing information from the main available public data sources, and c) enriching the graph nodes with expressive feature vectors such as molecular fingerprints and gene ontologies. Biologically and chemically relevant features improve the capacity of machine learning models to generate accurate and well-structured embedding spaces. The resulting resource represents a coherent and reliable biological knowledge graph that serves as a state-of-the-art platform to advance research in computational biology and precision medicine. Moreover, it offers the opportunity to benchmark graph-based machine learning and network medicine models on relevant tasks. We demonstrate the effectiveness of the proposed dataset by benchmarking it against the task of drug repurposing, PPI prediction, and side-effect prediction, modeled as link prediction problems.
- Abstract(参考訳): 人間の生物学の本質的な複雑さは、科学的理解に現在進行中の課題を提示している。
研究者たちは、人間の生命を定義する生物学的相互作用に関する知識を拡張するために、さまざまな分野に協力します。
AI方法論は、特に計算生物学において、タンパク質とタンパク質の相互作用(PPI)ネットワークや遺伝子機能ネットワークなどの生物学的実体をグラフデータ構造が効果的にモデル化する、科学的領域にわたる強力なツールとして登場した。
これらのネットワークは、遺伝子消失関連予測、薬物再精製、多薬効副作用研究など、最上位のネットワーク医療タスクのためのデータセットとして使用される。
機械学習モデルからの信頼性の高い予測には、高品質な基礎データが必要である。
本研究では,複数の公開データセットの統合と精錬によって構築された総合的な多目的生物知識グラフを提案する。
薬物補充知識グラフ(DRKG)に基づいて、我々は、タスクされたパイプラインを定義する。
a)DRKGに存在する不整合及び冗長性
ロ 主要な公開データソースからの合体情報及び
c) グラフノードを、分子指紋や遺伝子オントロジーなどの表現豊かな特徴ベクトルで豊かにする。
生物学的かつ化学的に関連する特徴は、機械学習モデルの能力を改善して、正確でよく構造化された埋め込み空間を生成する。
得られたリソースは、計算生物学と精密医療の研究を進めるための最先端のプラットフォームとして機能する、一貫性があり信頼性の高い生物学的知識グラフである。
さらに、グラフベースの機械学習とネットワークメディカルモデルを関連するタスクでベンチマークする機会を提供する。
リンク予測問題としてモデル化された薬物再資源化,PPI予測,副作用予測のタスクに対して,提案手法の有効性をベンチマークすることで,提案手法の有効性を実証する。
関連論文リスト
- Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - Extracting Protein-Protein Interactions (PPIs) from Biomedical
Literature using Attention-based Relational Context Information [5.456047952635665]
本研究は,二元的相互作用型ラベルを付加したベット型相互作用定義を用いた多元的PPIコーパスを提案する。
変換器を用いた深層学習手法は,関係表現のための関係文脈情報を利用して関係分類性能を向上させる。
このモデルの性能は, 広く研究されている4つのバイオメディカル関係抽出データセットで評価される。
論文 参考訳(メタデータ) (2024-03-08T01:43:21Z) - Graph Relation Distillation for Efficient Biomedical Instance
Segmentation [80.51124447333493]
本稿では,効率的なバイオメディカル・インスタンス・セグメンテーションのためのグラフ関係蒸留手法を提案する。
画像内レベルと画像間レベルの両方に展開する2つのグラフ蒸留方式を導入する。
多くのバイオメディカルデータセットの実験結果から,本手法の有効性が検証された。
論文 参考訳(メタデータ) (2024-01-12T04:41:23Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - Knowledge-augmented Graph Machine Learning for Drug Discovery: A Survey [6.288056740658763]
グラフ機械学習(GML)は、グラフ構造化バイオメディカルデータをモデル化する優れた能力で注目されている。
近年の研究では、より正確で解釈可能な薬物発見を実現するために、外部のバイオメディカル知識をGMLパイプラインに統合することを提案した。
論文 参考訳(メタデータ) (2023-02-16T12:38:01Z) - Predicting Biomedical Interactions with Probabilistic Model Selection
for Graph Neural Networks [5.156812030122437]
現在の生物学的ネットワークは、ノイズ、スパース、不完全であり、そのような相互作用の実験的同定には時間と費用がかかる。
ディープグラフニューラルネットワークは、グラフ構造データモデリングの有効性を示し、バイオメディカル相互作用予測において優れた性能を達成した。
提案手法により,グラフ畳み込みネットワークは,その深度を動的に適応し,対話数の増加に対応することができる。
論文 参考訳(メタデータ) (2022-11-22T20:44:28Z) - Graph-in-Graph (GiG): Learning interpretable latent graphs in
non-Euclidean domain for biological and healthcare applications [52.65389473899139]
グラフは、医療領域において、非ユークリッドな非ユークリッドデータをユビキタスに表現し、分析するための強力なツールである。
近年の研究では、入力データサンプル間の関係を考慮すると、下流タスクに正の正の正則化効果があることが示されている。
タンパク質分類と脳イメージングのためのニューラルネットワークアーキテクチャであるGraph-in-Graph(GiG)を提案する。
論文 参考訳(メタデータ) (2022-04-01T10:01:37Z) - Biomedical Knowledge Graph Refinement and Completion using Graph
Representation Learning and Top-K Similarity Measure [1.4660617536303606]
本研究は,統合生物医学知識グラフ chem2bio2rd の離散表現の学習を実証する。
学習した埋め込みベクトル間の単純なトップKコサイン類似度尺度を用いて知識グラフの補完と洗練を行う。
論文 参考訳(メタデータ) (2020-12-18T22:19:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。