論文の概要: Relationship extraction for knowledge graph creation from biomedical
literature
- arxiv url: http://arxiv.org/abs/2201.01647v1
- Date: Wed, 5 Jan 2022 15:09:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-06 15:59:14.895955
- Title: Relationship extraction for knowledge graph creation from biomedical
literature
- Title(参考訳): 生物医学文献からの知識グラフ作成のための関係抽出
- Authors: Nikola Milosevic, Wolfgang Thielemann
- Abstract要約: バイオメディカル文献からスケーラブルな関係抽出のためのルールベースと機械学習ベースの手法をほとんど提示し比較する。
我々は、これらの様々な手法が、不均衡で比較的小さなデータセットに対して、いかに回復力があるかを検討する。
最高のパフォーマンスモデルは、バランスの取れたデータに基づいて微調整されたT5モデルで、F1スコアは0.88と報告されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Biomedical research is growing in such an exponential pace that scientists,
researchers and practitioners are no more able to cope with the amount of
published literature in the domain. The knowledge presented in the literature
needs to be systematized in such a ways that claims and hypothesis can be
easily found, accessed and validated. Knowledge graphs can provide such
framework for semantic knowledge representation from literature. However, in
order to build knowledge graph, it is necessary to extract knowledge in form of
relationships between biomedical entities and normalize both entities and
relationship types. In this paper, we present and compare few rule-based and
machine learning-based (Naive Bayes, Random Forests as examples of traditional
machine learning methods and T5-based model as an example of modern deep
learning) methods for scalable relationship extraction from biomedical
literature for the integration into the knowledge graphs. We examine how
resilient are these various methods to unbalanced and fairly small datasets,
showing that T5 model handles well both small datasets, due to its pre-training
on large C4 dataset as well as unbalanced data. The best performing model was
T5 model fine-tuned on balanced data, with reported F1-score of 0.88.
- Abstract(参考訳): 生物医学の研究は指数関数的なペースで成長しており、科学者、研究者、実践者はドメイン内の出版文献の量に対処できない。
文献で提示される知識は、主張や仮説を容易に見つけ、アクセスし、検証できる方法で体系化する必要がある。
知識グラフは、文献から意味的知識を表現するためのフレームワークを提供することができる。
しかし, 知識グラフを構築するためには, バイオメディカルエンティティ間の関係の形で知識を抽出し, 実体と関係型の両方を正規化する必要がある。
本稿では、バイオメディカル文献からのスケーラブルな関係抽出手法として、ルールベースと機械学習ベース(ナイーブベイズ、ランダムフォレスト、現代の深層学習の例としてT5ベースのモデル)を、知識グラフに統合するために提示し、比較する。
T5モデルは、大きなC4データセットとバランスの取れていないデータで事前トレーニングされているため、小さなデータセットの両方をうまく扱えることを示す。
最高のパフォーマンスモデルはバランスの取れたデータに基づいて微調整されたT5モデルで、F1スコアは0.88である。
関連論文リスト
- Representation-Enhanced Neural Knowledge Integration with Application to Large-Scale Medical Ontology Learning [3.010503480024405]
本稿では,関係型の同時学習を実現するため,理論的に保証されたRENKIという統計フレームワークを提案する。
提案フレームワークは,表現学習出力をニューラルネットワークの初期エンティティ埋め込みに組み込んで,知識グラフのスコア関数を近似する。
ヘテロジニアス関係の存在下での重み付けの効果と、非パラメトリックモデルに表現学習を組み込むことの利点を実証する。
論文 参考訳(メタデータ) (2024-10-09T21:38:48Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Graph-Based Retriever Captures the Long Tail of Biomedical Knowledge [2.2814097119704058]
大規模言語モデル(LLM)は、膨大な知識を要約して提示することで、情報の検索方法を変えつつある。
LLMはトレーニングセットから最も頻繁に見られる情報を強調し、まれな情報を無視する傾向があります。
本稿では,これらのクラスタをダウンサンプリングし,情報過負荷問題を緩和するために知識グラフを活用する新しい情報検索手法を提案する。
論文 参考訳(メタデータ) (2024-02-19T18:31:11Z) - Graph Relation Distillation for Efficient Biomedical Instance
Segmentation [80.51124447333493]
本稿では,効率的なバイオメディカル・インスタンス・セグメンテーションのためのグラフ関係蒸留手法を提案する。
画像内レベルと画像間レベルの両方に展開する2つのグラフ蒸留方式を導入する。
多くのバイオメディカルデータセットの実験結果から,本手法の有効性が検証された。
論文 参考訳(メタデータ) (2024-01-12T04:41:23Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Implications of Topological Imbalance for Representation Learning on
Biomedical Knowledge Graphs [16.566710222582618]
知識グラフ埋め込みモデルが構造的不均衡によってどのように影響を受けるかを示す。
グラフトポロジを摂動させて、ランダムで生物学的に無意味な情報によって遺伝子ランクを人工的に変化させる方法を示す。
論文 参考訳(メタデータ) (2021-12-13T11:20:36Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - Biomedical Knowledge Graph Refinement and Completion using Graph
Representation Learning and Top-K Similarity Measure [1.4660617536303606]
本研究は,統合生物医学知識グラフ chem2bio2rd の離散表現の学習を実証する。
学習した埋め込みベクトル間の単純なトップKコサイン類似度尺度を用いて知識グラフの補完と洗練を行う。
論文 参考訳(メタデータ) (2020-12-18T22:19:57Z) - Benchmark and Best Practices for Biomedical Knowledge Graph Embeddings [8.835844347471626]
SNOMED-CT知識グラフ上に,いくつかの最先端知識グラフ埋め込みモデルを学習する。
本稿では,バイオメディカル知識表現の学習に知識グラフのマルチリレーショナルな性質を活用することの重要性を論じる。
論文 参考訳(メタデータ) (2020-06-24T14:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。