論文の概要: From Large Language Models to Knowledge Graphs for Biomarker Discovery
in Cancer
- arxiv url: http://arxiv.org/abs/2310.08365v1
- Date: Thu, 12 Oct 2023 14:36:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-14 11:11:21.307752
- Title: From Large Language Models to Knowledge Graphs for Biomarker Discovery
in Cancer
- Title(参考訳): がんにおけるバイオマーカー発見のための言語モデルから知識グラフへ
- Authors: Md. Rezaul Karim and Lina Molinas Comet and Md Shajalal and Oya Beyan
and Dietrich Rebholz-Schuhmann and Stefan Decker
- Abstract要約: 本稿では,がん特異的バイオマーカー発見と対話的QAを活用するドメインKGを開発する。
OncoNet Ontology(ONO)と呼ばれるドメインが開発され、遺伝子と退化の関係を検証するための意味論的推論を可能にする。
KGはONOによって豊かにされ、制御され、科学論文から追加の生体医学的概念が提供される。
- 参考スコア(独自算出の注目度): 0.9437165725355702
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Domain experts often rely on up-to-date knowledge for apprehending and
disseminating specific biological processes that help them design strategies to
develop prevention and therapeutic decision-making. A challenging scenario for
artificial intelligence (AI) is using biomedical data (e.g., texts, imaging,
omics, and clinical) to provide diagnosis and treatment recommendations for
cancerous conditions. Data and knowledge about cancer, drugs, genes, proteins,
and their mechanism is spread across structured (knowledge bases (KBs)) and
unstructured (e.g., scientific articles) sources. A large-scale knowledge graph
(KG) can be constructed by integrating these data, followed by extracting facts
about semantically interrelated entities and relations. Such KGs not only allow
exploration and question answering (QA) but also allow domain experts to deduce
new knowledge. However, exploring and querying large-scale KGs is tedious for
non-domain users due to a lack of understanding of the underlying data assets
and semantic technologies. In this paper, we develop a domain KG to leverage
cancer-specific biomarker discovery and interactive QA. For this, a domain
ontology called OncoNet Ontology (ONO) is developed to enable semantic
reasoning for validating gene-disease relations. The KG is then enriched by
harmonizing the ONO, controlled vocabularies, and additional biomedical
concepts from scientific articles by employing BioBERT- and SciBERT-based
information extraction (IE) methods. Further, since the biomedical domain is
evolving, where new findings often replace old ones, without employing
up-to-date findings, there is a high chance an AI system exhibits concept drift
while providing diagnosis and treatment. Therefore, we finetuned the KG using
large language models (LLMs) based on more recent articles and KBs that might
not have been seen by the named entity recognition models.
- Abstract(参考訳): ドメインの専門家は、予防と治療の意思決定を開発するための戦略を設計するのに役立つ特定の生物学的プロセスを逮捕し広めるために、最新の知識を頼りにすることが多い。
ai(artificial intelligence)の難解なシナリオは、生体医学データ(テキスト、画像、省略、臨床など)を使用して、がんの診断と治療の推奨を提供することだ。
がん、薬物、遺伝子、タンパク質とそのメカニズムに関するデータと知識は、構造化(知識ベース(kbs))と非構造化(科学記事など)ソースに分散している。
大規模知識グラフ(kg)は、これらのデータを統合し、セマンティックな相互関係の実体と関係に関する事実を抽出することによって構築することができる。
このようなKGは、探索と質問応答(QA)だけでなく、ドメインの専門家が新しい知識を引き出すことを可能にする。
しかし、データ資産やセマンティック技術に対する理解が不足しているため、大規模なKGの探索とクエリは非ドメインユーザにとって面倒である。
本稿では,癌特異的バイオマーカー発見と対話型QAを活用するドメインKGを開発する。
そのため、オンコネットオントロジー(ONO)と呼ばれるドメインオントロジーが開発され、遺伝子と退化の関係を検証するための意味論的推論を可能にする。
その後、ONOを調和させ、語彙を制御し、BioBERT-およびSciBERT-based information extract (IE)法を用いて、科学論文から生医学的な概念を追加することで、KGは豊かになる。
さらに、新しい発見が古い発見に取って代わられる場合が多い生体医学領域が進化しているため、aiシステムが診断と治療を提供しながら概念ドリフトを示す可能性が高い。
そこで我々は,名づけられたエンティティ認識モデルでは見られないような,最近の記事やkbsに基づいて,大言語モデル(llms)を用いてkgを微調整した。
関連論文リスト
- Unified Representation of Genomic and Biomedical Concepts through Multi-Task, Multi-Source Contrastive Learning [45.6771125432388]
言語モデル(genEREL)を用いたジェノミクス表現について紹介する。
GENERELは遺伝学と生物医学の知識基盤を橋渡しするために設計されたフレームワークである。
本実験は,SNPと臨床概念のニュアンス関係を効果的に把握するgenERELの能力を実証するものである。
論文 参考訳(メタデータ) (2024-10-14T04:19:52Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - Applying BioBERT to Extract Germline Gene-Disease Associations for Building a Knowledge Graph from the Biomedical Literature [0.0]
本稿では,ジェムリン遺伝子と疾患を結合する知識グラフ構築手法SimpleGermKGを提案する。
遺伝子および疾患の抽出には、バイオメディカルコーパス上でトレーニング済みのBERTモデルであるBioBERTを用いる。
記事,遺伝子,疾患間の意味的関連性について,部分的関係性アプローチを実装した。
知識グラフには297の遺伝子、130の疾患、46,747のトリプルが含まれている。
論文 参考訳(メタデータ) (2023-09-11T18:05:12Z) - Neurosymbolic AI for Reasoning on Biomedical Knowledge Graphs [0.9085310904484414]
バイオメディカルデータセットは、しばしば知識グラフ(KG)としてモデル化される。
したがって、KG完了(KGC)は、研究者が薬物再配置などのタスクを予測するのに役立ちます。
論文 参考訳(メタデータ) (2023-07-17T11:47:05Z) - BERT Based Clinical Knowledge Extraction for Biomedical Knowledge Graph
Construction and Analysis [0.4893345190925178]
本稿では,バイオメディカル臨床ノートからの知識抽出と分析のためのエンドツーエンドアプローチを提案する。
提案フレームワークは, 関連構造化情報を高精度に抽出できる。
論文 参考訳(メタデータ) (2023-04-21T14:45:33Z) - A Biomedical Knowledge Graph for Biomarker Discovery in Cancer [1.7860709946876898]
ドメイン固有知識グラフ(ドメイン特化知識グラフ、英: Domain-specific knowledge graph、KG)は、特定の主語・母語領域の明示的な概念化である。
KGは、がん関連の知識と複数のソースからの事実を統合することで構築される。
我々は、いくつかのクエリといくつかのQAの例を列挙し、KGに基づいた知識を導出する。
論文 参考訳(メタデータ) (2023-02-09T16:17:57Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Discovering Drug-Target Interaction Knowledge from Biomedical Literature [107.98712673387031]
人体における薬物と標的(DTI)の相互作用は、生物医学や応用において重要な役割を担っている。
毎年何百万もの論文がバイオメディカル分野で出回っているので、文学からDTIの知識を自動的に発見することは、業界にとって急激な需要となっている。
生成的アプローチを用いて,この課題に対する最初のエンドツーエンドソリューションについて検討する。
我々はDTI三重項をシーケンスとみなし、Transformerベースのモデルを使ってエンティティや関係の詳細なアノテーションを使わずに直接生成する。
論文 参考訳(メタデータ) (2021-09-27T17:00:14Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。