論文の概要: From Large Language Models to Knowledge Graphs for Biomarker Discovery
in Cancer
- arxiv url: http://arxiv.org/abs/2310.08365v2
- Date: Sun, 19 Nov 2023 17:27:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 17:31:25.387462
- Title: From Large Language Models to Knowledge Graphs for Biomarker Discovery
in Cancer
- Title(参考訳): がんにおけるバイオマーカー発見のための言語モデルから知識グラフへ
- Authors: Md. Rezaul Karim and Lina Molinas Comet and Md Shajalal and Oya Deniz
Beyan and Dietrich Rebholz-Schuhmann and Stefan Decker
- Abstract要約: 人工知能(AI)の難しいシナリオは、バイオメディカルデータを使用して、がんの病態の診断と治療のレコメンデーションを提供することである。
大規模知識グラフ(KG)は、意味的相互関連エンティティや関係に関する事実の統合と抽出によって構築することができる。
本稿では,癌特異的バイオマーカー発見と対話型QAを活用するドメインKGを開発する。
- 参考スコア(独自算出の注目度): 0.9437165725355702
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Domain experts often rely on most recent knowledge for apprehending and
disseminating specific biological processes that help them design strategies
for developing prevention and therapeutic decision-making in various disease
scenarios. A challenging scenarios for artificial intelligence (AI) is using
biomedical data (e.g., texts, imaging, omics, and clinical) to provide
diagnosis and treatment recommendations for cancerous conditions.~Data and
knowledge about biomedical entities like cancer, drugs, genes, proteins, and
their mechanism is spread across structured (knowledge bases (KBs)) and
unstructured (e.g., scientific articles) sources. A large-scale knowledge graph
(KG) can be constructed by integrating and extracting facts about semantically
interrelated entities and relations. Such a KG not only allows exploration and
question answering (QA) but also enables domain experts to deduce new
knowledge. However, exploring and querying large-scale KGs is tedious for
non-domain users due to their lack of understanding of the data assets and
semantic technologies. In this paper, we develop a domain KG to leverage
cancer-specific biomarker discovery and interactive QA. For this, we
constructed a domain ontology called OncoNet Ontology (ONO), which enables
semantic reasoning for validating gene-disease (different types of cancer)
relations. The KG is further enriched by harmonizing the ONO, metadata,
controlled vocabularies, and biomedical concepts from scientific articles by
employing BioBERT- and SciBERT-based information extractors. Further, since the
biomedical domain is evolving, where new findings often replace old ones,
without having access to up-to-date scientific findings, there is a high chance
an AI system exhibits concept drift while providing diagnosis and treatment.
Therefore, we fine-tune the KG using large language models (LLMs) based on more
recent articles and KBs.
- Abstract(参考訳): ドメインの専門家は、様々な疾患のシナリオにおける予防と治療的意思決定を開発するための戦略を設計するのに役立つ、特定の生物学的プロセスの調整と普及に、近年の知識に頼っていることが多い。
ai(artificial intelligence)の難解なシナリオは、生体医学データ(テキスト、画像、省略、臨床など)を使用して、がんの診断と治療の推奨を提供することだ。
~ がん、薬物、遺伝子、タンパク質などの生体医学的実体に関するデータと知識とそのメカニズムは、構造化された(知識ベース(kbs)と非構造化された(科学的記事など)ソースにまたがる。
大規模知識グラフ(KG)は、意味的相互関連エンティティや関係に関する事実の統合と抽出によって構築することができる。
このようなKGは、探索と質問応答(QA)を可能にするだけでなく、ドメインの専門家が新しい知識を推論することを可能にする。
しかし,データアセットやセマンティック技術に対する理解の欠如から,大規模KGの探索とクエリは非ドメインユーザにとって面倒である。
本稿では,癌特異的バイオマーカー発見と対話型QAを活用するドメインKGを開発する。
そこで我々は OncoNet Ontology (ONO) というドメインオントロジーを構築した。
KGは、ONO、メタデータ、制御された語彙、およびBioBERTおよびSciBERTベースの情報抽出装置を用いて、科学論文から生医学的な概念を調和させることによりさらに豊かになる。
さらに、生物医学領域は進化しており、新しい発見が古い発見に取って代わることが多いため、最新の科学的発見にアクセスできることなく、AIシステムが診断と治療を提供しながら概念ドリフトを示す可能性は高い。
そこで,より最近の論文やkbsに基づいて,大言語モデル(llms)を用いてkgを微調整する。
関連論文リスト
- Unified Representation of Genomic and Biomedical Concepts through Multi-Task, Multi-Source Contrastive Learning [45.6771125432388]
言語モデル(genEREL)を用いたジェノミクス表現について紹介する。
GENERELは遺伝学と生物医学の知識基盤を橋渡しするために設計されたフレームワークである。
本実験は,SNPと臨床概念のニュアンス関係を効果的に把握するgenERELの能力を実証するものである。
論文 参考訳(メタデータ) (2024-10-14T04:19:52Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - Applying BioBERT to Extract Germline Gene-Disease Associations for Building a Knowledge Graph from the Biomedical Literature [0.0]
本稿では,ジェムリン遺伝子と疾患を結合する知識グラフ構築手法SimpleGermKGを提案する。
遺伝子および疾患の抽出には、バイオメディカルコーパス上でトレーニング済みのBERTモデルであるBioBERTを用いる。
記事,遺伝子,疾患間の意味的関連性について,部分的関係性アプローチを実装した。
知識グラフには297の遺伝子、130の疾患、46,747のトリプルが含まれている。
論文 参考訳(メタデータ) (2023-09-11T18:05:12Z) - Neurosymbolic AI for Reasoning on Biomedical Knowledge Graphs [0.9085310904484414]
バイオメディカルデータセットは、しばしば知識グラフ(KG)としてモデル化される。
したがって、KG完了(KGC)は、研究者が薬物再配置などのタスクを予測するのに役立ちます。
論文 参考訳(メタデータ) (2023-07-17T11:47:05Z) - BERT Based Clinical Knowledge Extraction for Biomedical Knowledge Graph
Construction and Analysis [0.4893345190925178]
本稿では,バイオメディカル臨床ノートからの知識抽出と分析のためのエンドツーエンドアプローチを提案する。
提案フレームワークは, 関連構造化情報を高精度に抽出できる。
論文 参考訳(メタデータ) (2023-04-21T14:45:33Z) - A Biomedical Knowledge Graph for Biomarker Discovery in Cancer [1.7860709946876898]
ドメイン固有知識グラフ(ドメイン特化知識グラフ、英: Domain-specific knowledge graph、KG)は、特定の主語・母語領域の明示的な概念化である。
KGは、がん関連の知識と複数のソースからの事実を統合することで構築される。
我々は、いくつかのクエリといくつかのQAの例を列挙し、KGに基づいた知識を導出する。
論文 参考訳(メタデータ) (2023-02-09T16:17:57Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Discovering Drug-Target Interaction Knowledge from Biomedical Literature [107.98712673387031]
人体における薬物と標的(DTI)の相互作用は、生物医学や応用において重要な役割を担っている。
毎年何百万もの論文がバイオメディカル分野で出回っているので、文学からDTIの知識を自動的に発見することは、業界にとって急激な需要となっている。
生成的アプローチを用いて,この課題に対する最初のエンドツーエンドソリューションについて検討する。
我々はDTI三重項をシーケンスとみなし、Transformerベースのモデルを使ってエンティティや関係の詳細なアノテーションを使わずに直接生成する。
論文 参考訳(メタデータ) (2021-09-27T17:00:14Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。