論文の概要: Biomedical Multi-hop Question Answering Using Knowledge Graph Embeddings
and Language Models
- arxiv url: http://arxiv.org/abs/2211.05351v1
- Date: Thu, 10 Nov 2022 05:43:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 14:48:58.225642
- Title: Biomedical Multi-hop Question Answering Using Knowledge Graph Embeddings
and Language Models
- Title(参考訳): 知識グラフ埋め込みと言語モデルを用いたバイオメディカルマルチホップ質問応答
- Authors: Dattaraj J. Rao, Shraddha S. Mane, Mukta A. Paliwal
- Abstract要約: 我々は,バイオメディカルなマルチホップ質問応答システムをテストするために,自然言語を用いたマルチホップバイオメディカル質問応答データセットを開発した。
この研究の主な貢献は、言語モデルとKG埋め込みを組み合わせた統合システムであり、自由形式の質問に非常に関連性の高い回答を与える。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biomedical knowledge graphs (KG) are heterogenous networks consisting of
biological entities as nodes and relations between them as edges. These
entities and relations are extracted from millions of research papers and
unified in a single resource. The goal of biomedical multi-hop
question-answering over knowledge graph (KGQA) is to help biologist and
scientist to get valuable insights by asking questions in natural language.
Relevant answers can be found by first understanding the question and then
querying the KG for right set of nodes and relationships to arrive at an
answer. To model the question, language models such as RoBERTa and BioBERT are
used to understand context from natural language question. One of the
challenges in KGQA is missing links in the KG. Knowledge graph embeddings (KGE)
help to overcome this problem by encoding nodes and edges in a dense and more
efficient way. In this paper, we use a publicly available KG called Hetionet
which is an integrative network of biomedical knowledge assembled from 29
different databases of genes, compounds, diseases, and more. We have enriched
this KG dataset by creating a multi-hop biomedical question-answering dataset
in natural language for testing the biomedical multi-hop question-answering
system and this dataset will be made available to the research community. The
major contribution of this research is an integrated system that combines
language models with KG embeddings to give highly relevant answers to free-form
questions asked by biologists in an intuitive interface. Biomedical multi-hop
question-answering system is tested on this data and results are highly
encouraging.
- Abstract(参考訳): バイオメディカルナレッジグラフ(英: Biomedical knowledge graph, KG)は、ノードとしての生物学的実体とエッジとしてのそれらの関係からなる異種ネットワークである。
これらの実体と関係は何百万もの研究論文から抽出され、単一の資源に統合される。
バイオメディカル・マルチホップによる知識グラフ(KGQA)の目標は、生物学者や科学者が自然言語で質問することで貴重な洞察を得ることである。
関連する回答は、まず質問を理解して、その答えに到達するノードとリレーションシップの適切なセットについてkgに問い合わせることによって見つけることができる。
この問題をモデル化するために、RoBERTaやBioBERTといった言語モデルを用いて、自然言語の問題からコンテキストを理解する。
KGQAの課題の1つは、KGにリンクがないことである。
知識グラフ埋め込み(KGE)は、ノードとエッジをより密で効率的な方法で符号化することで、この問題を克服するのに役立つ。
本稿では,29種類の遺伝子,化合物,疾患などのデータベースから構築した,生物医学的知識の統合ネットワークであるhetionetという一般向けkgを用いた。
我々は,生物医学的マルチホップ質問応答システムをテストするために,自然言語でマルチホップ質問応答データセットを作成することにより,このkgデータセットを強化し,このデータセットを研究コミュニティに提供する。
この研究の主な貢献は、言語モデルとKG埋め込みを組み合わせた統合システムであり、生物学者が直感的なインタフェースで質問した自由形式の質問に非常に関連性の高い回答を与える。
このデータに基づいて生体医学的マルチホップ質問応答システムをテストする。
関連論文リスト
- Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - From Large Language Models to Knowledge Graphs for Biomarker Discovery
in Cancer [0.9437165725355702]
人工知能(AI)の難しいシナリオは、バイオメディカルデータを使用して、がんの病態の診断と治療のレコメンデーションを提供することである。
大規模知識グラフ(KG)は、意味的相互関連エンティティや関係に関する事実の統合と抽出によって構築することができる。
本稿では,癌特異的バイオマーカー発見と対話型QAを活用するドメインKGを開発する。
論文 参考訳(メタデータ) (2023-10-12T14:36:13Z) - Know2BIO: A Comprehensive Dual-View Benchmark for Evolving Biomedical
Knowledge Graphs [45.53337864477857]
Know2BIOは、バイオメディカルドメインのための汎用的なヘテロジニアスKGベンチマークである。
30の多様なソースからのデータを統合し、11のバイオメディカルカテゴリにわたる複雑な関係をキャプチャする。
Know2BIOは、バイオメディカルサイエンスの最新の知識を反映して、ユーザー指向の自動更新を行うことができる。
論文 参考訳(メタデータ) (2023-10-05T00:34:56Z) - Applying BioBERT to Extract Germline Gene-Disease Associations for Building a Knowledge Graph from the Biomedical Literature [0.0]
本稿では,ジェムリン遺伝子と疾患を結合する知識グラフ構築手法SimpleGermKGを提案する。
遺伝子および疾患の抽出には、バイオメディカルコーパス上でトレーニング済みのBERTモデルであるBioBERTを用いる。
記事,遺伝子,疾患間の意味的関連性について,部分的関係性アプローチを実装した。
知識グラフには297の遺伝子、130の疾患、46,747のトリプルが含まれている。
論文 参考訳(メタデータ) (2023-09-11T18:05:12Z) - Knowledge Graphs Querying [4.548471481431569]
我々は、KGクエリのために開発された様々な学際的なトピックと概念を統一することを目的としている。
KGとクエリ埋め込み、マルチモーダルKG、KG-QAの最近の進歩は、ディープラーニング、IR、NLP、コンピュータビジョンドメインから来ている。
論文 参考訳(メタデータ) (2023-05-23T19:32:42Z) - A Biomedical Knowledge Graph for Biomarker Discovery in Cancer [1.7860709946876898]
ドメイン固有知識グラフ(ドメイン特化知識グラフ、英: Domain-specific knowledge graph、KG)は、特定の主語・母語領域の明示的な概念化である。
KGは、がん関連の知識と複数のソースからの事実を統合することで構築される。
我々は、いくつかのクエリといくつかのQAの例を列挙し、KGに基づいた知識を導出する。
論文 参考訳(メタデータ) (2023-02-09T16:17:57Z) - Deep Bidirectional Language-Knowledge Graph Pretraining [159.9645181522436]
DRAGONは、テキストとKGを大規模に融合した言語知識基盤モデルを事前学習するための自己教師型アプローチである。
我々のモデルは、入力としてテキストセグメントと関連するKGサブグラフのペアを取り、両モードから情報を双方向に融合する。
論文 参考訳(メタデータ) (2022-10-17T18:02:52Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。