論文の概要: An Open-Source Knowledge Graph Ecosystem for the Life Sciences
- arxiv url: http://arxiv.org/abs/2307.05727v2
- Date: Tue, 30 Jan 2024 07:27:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 19:16:38.464579
- Title: An Open-Source Knowledge Graph Ecosystem for the Life Sciences
- Title(参考訳): 生命科学のためのオープンソースの知識グラフエコシステム
- Authors: Tiffany J. Callahan, Ignacio J. Tripodi, Adrianne L. Stefanski, Luca
Cappelletti, Sanya B. Taneja, Jordan M. Wyrwa, Elena Casiraghi, Nicolas A.
Matentzoglu, Justin Reese, Jonathan C. Silverstein, Charles Tapley Hoyt,
Richard D. Boyce, Scott A. Malec, Deepak R. Unni, Marcin P. Joachimiak, Peter
N. Robinson, Christopher J. Mungall, Emanuele Cavalleri, Tommaso Fontana,
Giorgio Valentini, Marco Mesiti, Lucas A. Gillenwater, Brook Santangelo,
Nicole A. Vasilevsky, Robert Hoehndorf, Tellen D. Bennett, Patrick B. Ryan,
George Hripcsak, Michael G. Kahn, Michael Bada, William A. Baumgartner Jr,
Lawrence E. Hunter
- Abstract要約: PheKnowLatorは、存在論的基盤を持つ知識グラフの構築を自動化するセマンティックエコシステムである。
エコシステムには、KG構築リソース、分析ツール、ベンチマークが含まれている。
PheKnowLatorは、パフォーマンスやユーザビリティを損なうことなく、完全にカスタマイズ可能なKGを可能にする。
- 参考スコア(独自算出の注目度): 5.665519167428707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Translational research requires data at multiple scales of biological
organization. Advancements in sequencing and multi-omics technologies have
increased the availability of these data, but researchers face significant
integration challenges. Knowledge graphs (KGs) are used to model complex
phenomena, and methods exist to construct them automatically. However, tackling
complex biomedical integration problems requires flexibility in the way
knowledge is modeled. Moreover, existing KG construction methods provide robust
tooling at the cost of fixed or limited choices among knowledge representation
models. PheKnowLator (Phenotype Knowledge Translator) is a semantic ecosystem
for automating the FAIR (Findable, Accessible, Interoperable, and Reusable)
construction of ontologically grounded KGs with fully customizable knowledge
representation. The ecosystem includes KG construction resources (e.g., data
preparation APIs), analysis tools (e.g., SPARQL endpoints and abstraction
algorithms), and benchmarks (e.g., prebuilt KGs and embeddings). We evaluated
the ecosystem by systematically comparing it to existing open-source KG
construction methods and by analyzing its computational performance when used
to construct 12 large-scale KGs. With flexible knowledge representation,
PheKnowLator enables fully customizable KGs without compromising performance or
usability.
- Abstract(参考訳): 翻訳研究は、生物組織の複数のスケールのデータを必要とする。
シークエンシングとマルチオミクス技術の進歩はこれらのデータの可用性を高めているが、研究者は重要な統合課題に直面している。
知識グラフ(KG)は複雑な現象をモデル化するために使われ、それらを自動的に構築する手法が存在する。
しかし、複雑なバイオメディカルな統合問題に取り組むには、知識のモデル化方法の柔軟性が必要である。
さらに、既存のkg構築手法は、知識表現モデルの中で固定あるいは制限された選択のコストで堅牢なツールを提供する。
PheKnowLator (Phenotype Knowledge Translator) は、完全にカスタマイズ可能な知識表現を持つ存在論的基盤を持つKGのFAIR (Findable, Accessible, Interoperable and Reusable) 構築を自動化するセマンティックエコシステムである。
エコシステムには、KG構築リソース(データ準備APIなど)、分析ツール(SPARQLエンドポイントや抽象化アルゴリズムなど)、ベンチマーク(KGや組み込みなど)が含まれている。
本研究では,既存のオープンソースkg構築手法と体系的に比較し,その計算性能を解析し,大規模kgの構築に用いた。
柔軟な知識表現により、pheknowlatorは性能やユーザビリティを損なうことなく、完全にカスタマイズ可能なkgsを実現する。
関連論文リスト
- Distill-SynthKG: Distilling Knowledge Graph Synthesis Workflow for Improved Coverage and Efficiency [59.6772484292295]
大規模言語モデル(LLM)によって生成される知識グラフ(KG)は、検索・拡張生成(RAG)アプリケーションにとってますます価値が増している。
既存のKG抽出法は、大規模コーパスの処理に非効率なプロンプトベースのアプローチに依存している。
LLMに基づく多段階文書レベルのKGワークフローであるSynthKGを提案する。
我々はまた、RAGのための新しいグラフベースの検索フレームワークを設計する。
論文 参考訳(メタデータ) (2024-10-22T00:47:54Z) - ConvKGYarn: Spinning Configurable and Scalable Conversational Knowledge Graph QA datasets with Large Language Models [47.27645876623092]
本稿では、最新のKGQAデータセットを生成するスケーラブルな方法であるConvKGYarnを提案する。
同じKGファクトセットに異なる構成を持つ会話型KGQA集合のモデル挙動を探索する。
論文 参考訳(メタデータ) (2024-08-12T06:48:43Z) - KG-FIT: Knowledge Graph Fine-Tuning Upon Open-World Knowledge [63.19837262782962]
知識グラフ埋め込み(KGE)技術は、知識グラフ内の実体と関係のコンパクトな表現を学習するために重要である。
本研究では、エンティティクラスタのセマンティックコヒーレントな階層構造を構築するKG-FITを紹介する。
ベンチマークデータセットFB15K-237、YAGO3-10、PrimeKGの実験は、最先端の訓練済み言語モデルに基づく手法よりもKG-FITの方が優れていることを示した。
論文 参考訳(メタデータ) (2024-05-26T03:04:26Z) - Leveraging Large Language Models for Semantic Query Processing in a Scholarly Knowledge Graph [1.7418328181959968]
本研究は,革新的なセマンティッククエリ処理システムを開発することを目的としている。
オーストラリア国立大学のコンピュータサイエンス(CS)研究者による研究成果に関する総合的な情報を得ることができる。
論文 参考訳(メタデータ) (2024-05-24T09:19:45Z) - From human experts to machines: An LLM supported approach to ontology
and knowledge graph construction [0.0]
大規模言語モデル(LLM)は、人間のような自然言語を理解し、生成する能力で最近人気を集めている。
本研究は,オープンソースLLMによって促進されるKGの半自動構築について考察する。
論文 参考訳(メタデータ) (2024-03-13T08:50:15Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - KG-Hub -- Building and Exchanging Biological Knowledge Graphs [0.5369297590461578]
KG-Hubは知識グラフの標準化された構築、交換、再利用を可能にするプラットフォームである。
現在のKG-Hubプロジェクトは、新型コロナウイルス研究、薬物再精製、微生物-環境相互作用、希少疾患研究などのユースケースにまたがっている。
論文 参考訳(メタデータ) (2023-01-31T21:29:35Z) - BertNet: Harvesting Knowledge Graphs with Arbitrary Relations from
Pretrained Language Models [65.51390418485207]
本稿では,事前学習したLMから任意の関係を持つ大規模KGを抽出する手法を提案する。
関係定義の最小限の入力により、アプローチは膨大な実体対空間を効率的に探索し、多様な正確な知識を抽出する。
我々は、異なるLMから400以上の新しい関係を持つKGを収穫するためのアプローチを展開している。
論文 参考訳(メタデータ) (2022-06-28T19:46:29Z) - Meta-Learning Based Knowledge Extrapolation for Knowledge Graphs in the
Federated Setting [43.85991094675398]
本稿では,新たな知識グラフ(KG)をフェデレートした環境に組み込むための知識補間問題について検討する。
この問題では、既存のKGでトレーニングされたモデルが、未知の実体と関係を持つ新しいKGを組み込む必要がある。
メタラーニング設定では、既存のKG上に一連のタスクをサンプリングし、新興KG上のリンク予測タスクを模倣する。
サンプルタスクに基づいてグラフニューラルネットワークフレームワークをメタトレーニングし,構造情報に基づく未知のコンポーネントの機能の構築と,それらに対する出力埋め込みを実現する。
論文 参考訳(メタデータ) (2022-05-10T06:27:32Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - KGTK: A Toolkit for Large Knowledge Graph Manipulation and Analysis [9.141014703209494]
KGTKは、KGを表現、生成、変換、拡張、分析するために設計されたデータサイエンス中心のツールキットである。
我々はKGTKを使ってWikidataやDBpedia、ConceptNetといった大規模なKGを統合・操作する現実世界のシナリオでこのフレームワークを説明します。
論文 参考訳(メタデータ) (2020-05-29T21:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。