論文の概要: BIOS: An Algorithmically Generated Biomedical Knowledge Graph
- arxiv url: http://arxiv.org/abs/2203.09975v1
- Date: Fri, 18 Mar 2022 14:09:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-21 13:52:59.833401
- Title: BIOS: An Algorithmically Generated Biomedical Knowledge Graph
- Title(参考訳): BIOS:アルゴリズムで生成されたバイオメディカル知識グラフ
- Authors: Sheng Yu, Zheng Yuan, Jun Xia, Shengxuan Luo, Huaiyuan Ying, Sihang
Zeng, Jingyi Ren, Hongyi Yuan, Zhengyun Zhao, Yucong Lin, Keming Lu, Jing
Wang, Yutao Xie, Heung-Yeung Shum
- Abstract要約: バイオメディカル・インフォマティクス・オントロジー・システム(BIOS)は,機械学習アルゴリズムによって完全に生成される,最初の大規模公開可能なBioMedKGである。
BIOSには4100万のコンセプト、2つの言語で740万の用語と730万のリレーション・トリプルが含まれている。
結果は、機械学習ベースのBioMedKG開発が、従来の専門家のキュレーションを置き換えるための、完全に実行可能なソリューションであることを示唆している。
- 参考スコア(独自算出の注目度): 4.030892610300306
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Biomedical knowledge graphs (BioMedKGs) are essential infrastructures for
biomedical and healthcare big data and artificial intelligence (AI),
facilitating natural language processing, model development, and data exchange.
For many decades, these knowledge graphs have been built via expert curation,
which can no longer catch up with the speed of today's AI development, and a
transition to algorithmically generated BioMedKGs is necessary. In this work,
we introduce the Biomedical Informatics Ontology System (BIOS), the first large
scale publicly available BioMedKG that is fully generated by machine learning
algorithms. BIOS currently contains 4.1 million concepts, 7.4 million terms in
two languages, and 7.3 million relation triplets. We introduce the methodology
for developing BIOS, which covers curation of raw biomedical terms,
computationally identifying synonymous terms and aggregating them to create
concept nodes, semantic type classification of the concepts, relation
identification, and biomedical machine translation. We provide statistics about
the current content of BIOS and perform preliminary assessment for term
quality, synonym grouping, and relation extraction. Results suggest that
machine learning-based BioMedKG development is a totally viable solution for
replacing traditional expert curation.
- Abstract(参考訳): バイオメディカル・ナレッジグラフ(バイオメディカル・ナレッジグラフ、BioMedKG)は、バイオメディカルおよび医療用ビッグデータと人工知能(AI)にとって不可欠な基盤であり、自然言語処理、モデル開発、データ交換を容易にする。
何十年もの間、これらの知識グラフは専門家のキュレーションによって構築され、今日のAI開発速度に追いつかなくなり、アルゴリズムによって生成されたBioMedKGsへの移行が必要である。
そこで本研究では,機械学習アルゴリズムによって完全に生成された初の大規模バイオメディカルインフォマティクスオントロジーシステム (bios) を紹介する。
BIOSは現在4100万のコンセプト、2つの言語で740万の用語と730万のリレーション・トリプルを含んでいる。
生バイオメディカル用語のキュレーション,同義語を計算的に識別し,それらを集約して概念ノードを作成するBIOSの開発手法,概念の意味型分類,関係同定,バイオメディカル機械翻訳について紹介する。
我々はbiosの現在の内容に関する統計を提供し, 用語品質, 同義語グループ化, 関係抽出の予備評価を行う。
結果は、機械学習ベースのBioMedKG開発は、従来のエキスパートキュレーションを置き換えるための、完全に実行可能なソリューションであることを示唆している。
関連論文リスト
- Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - Know2BIO: A Comprehensive Dual-View Benchmark for Evolving Biomedical
Knowledge Graphs [45.53337864477857]
Know2BIOは、バイオメディカルドメインのための汎用的なヘテロジニアスKGベンチマークである。
30の多様なソースからのデータを統合し、11のバイオメディカルカテゴリにわたる複雑な関係をキャプチャする。
Know2BIOは、バイオメディカルサイエンスの最新の知識を反映して、ユーザー指向の自動更新を行うことができる。
論文 参考訳(メタデータ) (2023-10-05T00:34:56Z) - Neurosymbolic AI for Reasoning on Biomedical Knowledge Graphs [0.9085310904484414]
バイオメディカルデータセットは、しばしば知識グラフ(KG)としてモデル化される。
したがって、KG完了(KGC)は、研究者が薬物再配置などのタスクを予測するのに役立ちます。
論文 参考訳(メタデータ) (2023-07-17T11:47:05Z) - Exploring the In-context Learning Ability of Large Language Model for
Biomedical Concept Linking [4.8882241537236455]
本研究では,生物医学的概念リンクのための大規模モデルのコンテキスト内学習機能を活用する手法について検討する。
提案手法は2段階のレトリーブ・アンド・ランク・フレームワークを採用する。
BC5CDRの病体正規化では90.%、化学体正規化では94.7%の精度を達成した。
論文 参考訳(メタデータ) (2023-07-03T16:19:50Z) - LLaVA-Med: Training a Large Language-and-Vision Assistant for
Biomedicine in One Day [85.19963303642427]
本稿では,バイオメディカルイメージのオープンな研究課題に答えられる視覚言語対話アシスタントを訓練するための費用効率のよいアプローチを提案する。
モデルはまず、フィギュア・キャプションのペアを使ってバイオメディカル・ボキャブラリをアライメントし、その後、オープンエンドの会話意味論を習得する。
これにより、バイオメディジンのための大規模言語と視覚アシスタントを15時間以内で(8つのA100で)訓練することができる。
論文 参考訳(メタデータ) (2023-06-01T16:50:07Z) - BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks [68.39821375903591]
汎用AIは、さまざまなデータ型を解釈する汎用性のために、制限に対処する可能性を秘めている。
本稿では,最初のオープンソースかつ軽量な視覚言語基盤モデルであるBiomedGPTを提案する。
論文 参考訳(メタデータ) (2023-05-26T17:14:43Z) - BioGPT: Generative Pre-trained Transformer for Biomedical Text
Generation and Mining [140.61707108174247]
本稿では,大規模生物医学文献に基づいて事前学習したドメイン固有生成型トランスフォーマー言語モデルであるBioGPTを提案する。
BC5CDRでは44.98%、38.42%、40.76%のF1スコア、KD-DTIとDDIの関係抽出タスクでは78.2%、PubMedQAでは78.2%の精度が得られた。
論文 参考訳(メタデータ) (2022-10-19T07:17:39Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。