論文の概要: Biomedical Knowledge Graph Refinement and Completion using Graph
Representation Learning and Top-K Similarity Measure
- arxiv url: http://arxiv.org/abs/2012.10540v1
- Date: Fri, 18 Dec 2020 22:19:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 19:07:17.193208
- Title: Biomedical Knowledge Graph Refinement and Completion using Graph
Representation Learning and Top-K Similarity Measure
- Title(参考訳): グラフ表現学習とトップk類似度尺度を用いた生体医学知識グラフの洗練・完成
- Authors: Islam Akef Ebeid, Majdi Hassan, Tingyi Wanyan, Jack Roper, Abhik Seal,
Ying Ding
- Abstract要約: 本研究は,統合生物医学知識グラフ chem2bio2rd の離散表現の学習を実証する。
学習した埋め込みベクトル間の単純なトップKコサイン類似度尺度を用いて知識グラフの補完と洗練を行う。
- 参考スコア(独自算出の注目度): 1.4660617536303606
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Knowledge Graphs have been one of the fundamental methods for integrating
heterogeneous data sources. Integrating heterogeneous data sources is crucial,
especially in the biomedical domain, where central data-driven tasks such as
drug discovery rely on incorporating information from different biomedical
databases. These databases contain various biological entities and relations
such as proteins (PDB), genes (Gene Ontology), drugs (DrugBank), diseases
(DDB), and protein-protein interactions (BioGRID). The process of semantically
integrating heterogeneous biomedical databases is often riddled with
imperfections. The quality of data-driven drug discovery relies on the accuracy
of the mining methods used and the data's quality as well. Thus, having
complete and refined biomedical knowledge graphs is central to achieving more
accurate drug discovery outcomes. Here we propose using the latest graph
representation learning and embedding models to refine and complete biomedical
knowledge graphs. This preliminary work demonstrates learning discrete
representations of the integrated biomedical knowledge graph Chem2Bio2RD [3].
We perform a knowledge graph completion and refinement task using a simple
top-K cosine similarity measure between the learned embedding vectors to
predict missing links between drugs and targets present in the data. We show
that this simple procedure can be used alternatively to binary classifiers in
link prediction.
- Abstract(参考訳): 知識グラフは異種データソースを統合するための基本的な方法の1つだ。
異種データソースの統合は、特にバイオメディカル領域において重要であり、薬物発見のような中心的なデータ駆動タスクは、異なるバイオメディカルデータベースの情報を統合することに依存する。
これらのデータベースには、タンパク質(PDB)、遺伝子(遺伝子オントロジー)、薬物(DrugBank)、疾患(DDB)、タンパク質-タンパク質相互作用(BioGRID)など様々な生物学的実体と関係がある。
不均一な生物医学データベースを意味的に統合するプロセスには、しばしば不完全さが伴う。
データ駆動型薬物発見の品質は、使用される採掘方法の精度とデータの品質にも依存している。
したがって、完全かつ洗練されたバイオメディカル知識グラフを持つことは、より正確な薬物発見結果を達成するための中心となる。
本稿では、最新のグラフ表現学習と埋め込みモデルを用いて、バイオメディカル知識グラフの洗練と完全化を提案する。
この予備的な研究は、統合バイオメディカル知識グラフChem2Bio2RD[3]の学習離散表現を示す。
学習された埋め込みベクトル間の単純なトップkコサイン類似度尺度を用いて,知識グラフの補完・精細化タスクを行い,データに存在する薬物と標的間の欠落リンクを予測する。
リンク予測において,この単純な手続きをバイナリ分類器に代えて使用できることを示す。
関連論文リスト
- Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [125.80680614611482]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z) - Graph-in-Graph (GiG): Learning interpretable latent graphs in
non-Euclidean domain for biological and healthcare applications [52.65389473899139]
グラフは、医療領域において、非ユークリッドな非ユークリッドデータをユビキタスに表現し、分析するための強力なツールである。
近年の研究では、入力データサンプル間の関係を考慮すると、下流タスクに正の正の正則化効果があることが示されている。
タンパク質分類と脳イメージングのためのニューラルネットワークアーキテクチャであるGraph-in-Graph(GiG)を提案する。
論文 参考訳(メタデータ) (2022-04-01T10:01:37Z) - Self-supervised Representation Learning of Neuronal Morphologies [67.57317946062773]
ニューロンの3次元形態の低次元表現を学習するための、純粋にデータ駆動型アプローチであるGraphDINOを提案する。
本手法は,手動特徴量に基づく分類に匹敵する形態的細胞型クラスタリングを実現することができることを示す。
本手法は,データセット中のサンプルがグラフであり,グラフレベルの埋め込みが望まれる設定において,神経科学を超えて適用可能である。
論文 参考訳(メタデータ) (2021-12-23T12:17:47Z) - Implications of Topological Imbalance for Representation Learning on
Biomedical Knowledge Graphs [16.566710222582618]
知識グラフ埋め込みモデルが構造的不均衡によってどのように影響を受けるかを示す。
グラフトポロジを摂動させて、ランダムで生物学的に無意味な情報によって遺伝子ランクを人工的に変化させる方法を示す。
論文 参考訳(メタデータ) (2021-12-13T11:20:36Z) - GraphPrompt: Biomedical Entity Normalization Using Graph-based Prompt
Templates [4.495494201948124]
生物医学的な実体の正規化は、生物医学的な実験と研究にまたがって言語を統一する。
まず,70種類のエンティティと200万のキュレートされたエンティティとシンノニムのペアを含む,専門家によるデータベースOBO-synを紹介する。
グラフに応じてプロンプトテンプレートを生成するプロンプトベースの学習手法であるGraphPromptを提案する。
論文 参考訳(メタデータ) (2021-11-13T06:59:27Z) - BioIE: Biomedical Information Extraction with Multi-head Attention
Enhanced Graph Convolutional Network [9.227487525657901]
本稿では,バイオメディカルテキストと非構造化医療報告から関係を抽出するハイブリッドニューラルネットワークであるバイオメディカル情報抽出を提案する。
本研究は,2つの主要な生医学的関係抽出タスク,化学物質とタンパク質の相互作用,およびクロスホスピタル・パン・カンノロジー報告コーパスについて検討した。
論文 参考訳(メタデータ) (2021-10-26T13:19:28Z) - Discovering Drug-Target Interaction Knowledge from Biomedical Literature [107.98712673387031]
人体における薬物と標的(DTI)の相互作用は、生物医学や応用において重要な役割を担っている。
毎年何百万もの論文がバイオメディカル分野で出回っているので、文学からDTIの知識を自動的に発見することは、業界にとって急激な需要となっている。
生成的アプローチを用いて,この課題に対する最初のエンドツーエンドソリューションについて検討する。
我々はDTI三重項をシーケンスとみなし、Transformerベースのモデルを使ってエンティティや関係の詳細なアノテーションを使わずに直接生成する。
論文 参考訳(メタデータ) (2021-09-27T17:00:14Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - Neural Multi-Hop Reasoning With Logical Rules on Biomedical Knowledge
Graphs [10.244651735862627]
我々は,創薬の現実世界における課題に基づいて経験的研究を行う。
我々は,この課題を,化合物と疾患の両方が知識グラフの実体に対応するリンク予測問題として定式化する。
本稿では,強化学習と論理ルールに基づく政策誘導歩行を組み合わせた新しい手法PoLoを提案する。
論文 参考訳(メタデータ) (2021-03-18T16:46:11Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - A Literature Review of Recent Graph Embedding Techniques for Biomedical
Data [36.446560017794845]
このようなデータを分析するために,グラフに基づく学習法が数多く提案されている。
主な困難は、バイオメディカルグラフの高次元性と空間性を扱う方法である。
グラフ埋め込みメソッドは、上記の問題に対処するための効率的かつ効率的な方法を提供する。
論文 参考訳(メタデータ) (2021-01-17T01:53:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。