論文の概要: Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study
- arxiv url: http://arxiv.org/abs/2106.09700v1
- Date: Thu, 17 Jun 2021 17:55:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-18 16:10:31.641252
- Title: Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study
- Title(参考訳): バイオメディカル知識ベース完成のための科学的言語モデル:実証的研究
- Authors: Rahul Nadkarni, David Wadden, Iz Beltagy, Noah A. Smith, Hannaneh
Hajishirzi, Tom Hope
- Abstract要約: 我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
- 参考スコア(独自算出の注目度): 62.376800537374024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biomedical knowledge graphs (KGs) hold rich information on entities such as
diseases, drugs, and genes. Predicting missing links in these graphs can boost
many important applications, such as drug design and repurposing. Recent work
has shown that general-domain language models (LMs) can serve as "soft" KGs,
and that they can be fine-tuned for the task of KG completion. In this work, we
study scientific LMs for KG completion, exploring whether we can tap into their
latent knowledge to enhance biomedical link prediction. We evaluate several
domain-specific LMs, fine-tuning them on datasets centered on drugs and
diseases that we represent as KGs and enrich with textual entity descriptions.
We integrate the LM-based models with KG embedding models, using a router
method that learns to assign each input example to either type of model and
provides a substantial boost in performance. Finally, we demonstrate the
advantage of LM models in the inductive setting with novel scientific entities.
Our datasets and code are made publicly available.
- Abstract(参考訳): 生体医学知識グラフ(kgs)は、疾患、薬物、遺伝子などの実体に関する豊富な情報を持っている。
これらのグラフに欠落するリンクを予測することは、ドラッグデザインや再購入など、多くの重要な応用を促進する可能性がある。
近年の研究では、ジェネラルドメイン言語モデル(LM)が「ソフト」なKGとして機能し、KG完了のタスクのために微調整できることが示されている。
そこで本研究では,KG 完成のための科学的 LM について検討し,生物医学的リンク予測を強化するために潜伏した知識を活用できるかどうかを考察する。
いくつかのドメイン固有のLMを評価し、KGとして表現する薬物や疾患を中心としたデータセットを微調整し、テキストエンティティ記述に富む。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
最後に,新しい科学的実体を用いた帰納的設定におけるlmモデルの利点を示す。
データセットとコードは公開されています。
関連論文リスト
- A Survey on Knowledge Graphs for Healthcare: Resources, Applications,
and Promises [47.969042848823086]
医療知識グラフ(HKG)は、構造化され解釈可能な方法で医療知識を組織化するための有望なツールとして登場した。
本調査は,HKGの総合的な概要を初めて明らかにした。
論文 参考訳(メタデータ) (2023-06-07T21:51:56Z) - BioBLP: A Modular Framework for Learning on Multimodal Biomedical
Knowledge Graphs [3.780924717521521]
知識グラフへの埋め込みを学習するためのモジュラーフレームワークを提案する。
異なるモダリティの属性データをエンコードできると同時に、属性が欠けているエンティティもサポートする。
約200万トリプルのバイオメディカルKGを用いてモデルを訓練する。
論文 参考訳(メタデータ) (2023-06-06T11:49:38Z) - Knowledge-augmented Graph Machine Learning for Drug Discovery: A Survey
from Precision to Interpretability [5.31117862338528]
グラフ機械学習(GML)は、グラフ構造化バイオメディカルデータをモデル化する優れた能力で注目されている。
近年の研究では、より正確で解釈可能な薬物発見を実現するために、外部のバイオメディカル知識をGMLパイプラインに統合することを提案した。
論文 参考訳(メタデータ) (2023-02-16T12:38:01Z) - KG-Hub -- Building and Exchanging Biological Knowledge Graphs [0.5369297590461578]
KG-Hubは知識グラフの標準化された構築、交換、再利用を可能にするプラットフォームである。
現在のKG-Hubプロジェクトは、新型コロナウイルス研究、薬物再精製、微生物-環境相互作用、希少疾患研究などのユースケースにまたがっている。
論文 参考訳(メタデータ) (2023-01-31T21:29:35Z) - A Survey of Knowledge Graph Reasoning on Graph Types: Static, Dynamic,
and Multimodal [57.8455911689554]
知識グラフ推論(KGR)は、知識グラフに基づくマイニング論理則に基づいて、既存の事実から新しい事実を推論することを目的としている。
質問応答やレコメンデーションシステムなど、多くのAIアプリケーションでKGを使うことに大きなメリットがあることが証明されている。
論文 参考訳(メタデータ) (2022-12-12T08:40:04Z) - Analysis of Drug repurposing Knowledge graphs for Covid-19 [0.0]
本研究は、薬物再資源知識グラフ(DRKG)を用いた新型コロナウイルスの候補薬剤のセットを提案する。
DRKGは、大量のオープンソースバイオメディカル知識を用いて構築された生物学的知識グラフである。
ノードと関係埋め込みは知識グラフ埋め込みモデルとニューラルネットワークおよび注意関連モデルを用いて学習される。
論文 参考訳(メタデータ) (2022-12-07T19:14:17Z) - Deep Bidirectional Language-Knowledge Graph Pretraining [159.9645181522436]
DRAGONは、テキストとKGを大規模に融合した言語知識基盤モデルを事前学習するための自己教師型アプローチである。
我々のモデルは、入力としてテキストセグメントと関連するKGサブグラフのペアを取り、両モードから情報を双方向に融合する。
論文 参考訳(メタデータ) (2022-10-17T18:02:52Z) - BertNet: Harvesting Knowledge Graphs with Arbitrary Relations from
Pretrained Language Models [65.51390418485207]
本稿では,事前学習したLMから任意の関係を持つ大規模KGを抽出する手法を提案する。
関係定義の最小限の入力により、アプローチは膨大な実体対空間を効率的に探索し、多様な正確な知識を抽出する。
我々は、異なるLMから400以上の新しい関係を持つKGを収穫するためのアプローチを展開している。
論文 参考訳(メタデータ) (2022-06-28T19:46:29Z) - Biomedical Knowledge Graph Refinement and Completion using Graph
Representation Learning and Top-K Similarity Measure [1.4660617536303606]
本研究は,統合生物医学知識グラフ chem2bio2rd の離散表現の学習を実証する。
学習した埋め込みベクトル間の単純なトップKコサイン類似度尺度を用いて知識グラフの補完と洗練を行う。
論文 参考訳(メタデータ) (2020-12-18T22:19:57Z) - SumGNN: Multi-typed Drug Interaction Prediction via Efficient Knowledge
Graph Summarization [64.56399911605286]
本稿では,サブグラフ抽出モジュールによって実現された知識要約グラフニューラルネットワークSumGNNを提案する。
SumGNNは5.54%まで最高のベースラインを上回り、データ関係の低いタイプでは特にパフォーマンスの向上が顕著である。
論文 参考訳(メタデータ) (2020-10-04T00:14:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。