論文の概要: Know2BIO: A Comprehensive Dual-View Benchmark for Evolving Biomedical
Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2310.03221v1
- Date: Thu, 5 Oct 2023 00:34:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 19:48:09.023211
- Title: Know2BIO: A Comprehensive Dual-View Benchmark for Evolving Biomedical
Knowledge Graphs
- Title(参考訳): Know2BIO: バイオメディカル知識グラフの進化のための総合的なデュアルビューベンチマーク
- Authors: Yijia Xiao, Dylan Steinecke, Alexander Russell Pelletier, Yushi Bai,
Peipei Ping, Wei Wang
- Abstract要約: Know2BIOは、バイオメディカルドメインのための汎用的なヘテロジニアスKGベンチマークである。
30の多様なソースからのデータを統合し、11のバイオメディカルカテゴリにわたる複雑な関係をキャプチャする。
Know2BIOは、バイオメディカルサイエンスの最新の知識を反映して、ユーザー指向の自動更新を行うことができる。
- 参考スコア(独自算出の注目度): 45.53337864477857
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge graphs (KGs) have emerged as a powerful framework for representing
and integrating complex biomedical information. However, assembling KGs from
diverse sources remains a significant challenge in several aspects, including
entity alignment, scalability, and the need for continuous updates to keep pace
with scientific advancements. Moreover, the representative power of KGs is
often limited by the scarcity of multi-modal data integration. To overcome
these challenges, we propose Know2BIO, a general-purpose heterogeneous KG
benchmark for the biomedical domain. Know2BIO integrates data from 30 diverse
sources, capturing intricate relationships across 11 biomedical categories. It
currently consists of ~219,000 nodes and ~6,200,000 edges. Know2BIO is capable
of user-directed automated updating to reflect the latest knowledge in
biomedical science. Furthermore, Know2BIO is accompanied by multi-modal data:
node features including text descriptions, protein and compound sequences and
structures, enabling the utilization of emerging natural language processing
methods and multi-modal data integration strategies. We evaluate KG
representation models on Know2BIO, demonstrating its effectiveness as a
benchmark for KG representation learning in the biomedical field. Data and
source code of Know2BIO are available at
https://github.com/Yijia-Xiao/Know2BIO/.
- Abstract(参考訳): 知識グラフ(KG)は、複雑な生体情報の表現と統合のための強力なフレームワークとして登場した。
しかし、さまざまなソースからkgを組み立てることは、エンティティのアライメント、スケーラビリティ、科学的な進歩に対応する継続的更新の必要性など、いくつかの面で大きな課題である。
さらに、KGsの代表的なパワーは、マルチモーダルデータ統合の不足によって制限されることが多い。
これらの課題を克服するために,バイオメディカルドメインのための汎用ヘテロジニアスKGベンチマークである Know2BIO を提案する。
Know2BIOは、30の多様なソースからのデータを統合する。
現在は219,000のノードと6200,000のエッジで構成されている。
Know2BIOは、バイオメディカルサイエンスの最新の知識を反映して、ユーザー指向の自動更新を行うことができる。
さらに、Know2BIOにはマルチモーダルデータがある: テキスト記述、タンパク質、複合配列、構造を含むノード機能により、出現する自然言語処理手法とマルチモーダルデータ統合戦略の利用が可能になる。
バイオメディカル分野におけるKG表現学習のベンチマークとしての有効性を実証し,KG表現モデルの評価を行った。
Know2BIOのデータとソースコードはhttps://github.com/Yijia-Xiao/Know2BIO/で入手できる。
関連論文リスト
- Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - BioT5+: Towards Generalized Biological Understanding with IUPAC Integration and Multi-task Tuning [77.90250740041411]
本稿では,BioT5フレームワークの拡張であるBioT5+を紹介する。
BioT5+ には、分子理解のための IUPAC 名の統合、bioRxiv や PubChem などのソースからの広範なバイオテキストと分子データの統合、タスク間の汎用性のためのマルチタスク命令チューニング、数値データの処理を改善する数値トークン化技術など、いくつかの新機能が含まれている。
論文 参考訳(メタデータ) (2024-02-27T12:43:09Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - From Large Language Models to Knowledge Graphs for Biomarker Discovery
in Cancer [0.9437165725355702]
人工知能(AI)の難しいシナリオは、バイオメディカルデータを使用して、がんの病態の診断と治療のレコメンデーションを提供することである。
大規模知識グラフ(KG)は、意味的相互関連エンティティや関係に関する事実の統合と抽出によって構築することができる。
本稿では,癌特異的バイオマーカー発見と対話型QAを活用するドメインKGを開発する。
論文 参考訳(メタデータ) (2023-10-12T14:36:13Z) - BioT5: Enriching Cross-modal Integration in Biology with Chemical
Knowledge and Natural Language Associations [54.97423244799579]
$mathbfBioT5$は、化学知識と自然言語の関連性によって生物学のクロスモーダルな統合を強化する事前学習フレームワークである。
$mathbfBioT5$は構造化知識と非構造化知識を区別し、より効果的な情報利用につながる。
論文 参考訳(メタデータ) (2023-10-11T07:57:08Z) - Biomedical Multi-hop Question Answering Using Knowledge Graph Embeddings
and Language Models [0.0]
我々は,バイオメディカルなマルチホップ質問応答システムをテストするために,自然言語を用いたマルチホップバイオメディカル質問応答データセットを開発した。
この研究の主な貢献は、言語モデルとKG埋め込みを組み合わせた統合システムであり、自由形式の質問に非常に関連性の高い回答を与える。
論文 参考訳(メタデータ) (2022-11-10T05:43:57Z) - BigBIO: A Framework for Data-Centric Biomedical Natural Language
Processing [13.30221348538759]
バイオメディカルNLPデータセット126以上のコミュニティライブラリであるBigBIOを紹介する。
BigBIOは、データセットとそのメタデータへのプログラムアクセスを通じて、再現可能なメタデータキュレーションを容易にする。
本稿では,タスクスキーマ,データ監査,コントリビューションガイドライン,および2つの実証的ユースケースの概要について論じる。
論文 参考訳(メタデータ) (2022-06-30T07:15:45Z) - BIOS: An Algorithmically Generated Biomedical Knowledge Graph [4.030892610300306]
バイオメディカル・インフォマティクス・オントロジー・システム(BIOS)は,機械学習アルゴリズムによって完全に生成される,最初の大規模公開可能なBioMedKGである。
BIOSには4100万のコンセプト、2つの言語で740万の用語と730万のリレーション・トリプルが含まれている。
結果は、機械学習ベースのBioMedKG開発が、従来の専門家のキュレーションを置き換えるための、完全に実行可能なソリューションであることを示唆している。
論文 参考訳(メタデータ) (2022-03-18T14:09:22Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。