論文の概要: gBuilder: A Scalable Knowledge Graph Construction System for
Unstructured Corpus
- arxiv url: http://arxiv.org/abs/2208.09705v1
- Date: Sat, 20 Aug 2022 15:07:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 12:58:27.202726
- Title: gBuilder: A Scalable Knowledge Graph Construction System for
Unstructured Corpus
- Title(参考訳): 非構造化コーパスのためのスケーラブルな知識グラフ構築システムgbuilder
- Authors: Yanzeng Li, Lei Zou
- Abstract要約: 我々は,構造化されていないコーパスから構造化知識を抽出する,ユーザフレンドリでスケーラブルな知識グラフ構築システム(KGC)を設計する。
gBuilderは、IEモデルの迅速な開発を取り入れた、フレキシブルでユーザ定義のパイプラインを提供する。
また,大規模知識グラフ構築におけるスケーラビリティを確保するために,gBuilderのためのクラウドベースの自己適応型タスクスケジューリングを設計する。
- 参考スコア(独自算出の注目度): 11.374986017876997
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We design a user-friendly and scalable knowledge graph construction (KGC)
system for extracting structured knowledge from the unstructured corpus.
Different from existing KGC systems, gBuilder provides a flexible and
user-defined pipeline to embracing the rapid development of IE models. More
built-in template-based or heuristic operators and programmable operators are
available for adapting to data from different domains. Furthermore, we also
design a cloud-based self-adaptive task scheduling for gBuilder to ensure its
scalability on large-scale knowledge graph construction. Experimental
evaluation not only demonstrates the ability of gBuilder to organize multiple
information extraction models for knowledge graph construction in a uniform
platform, and also confirms its high scalability on large-scale KGC task.
- Abstract(参考訳): 非構造化コーパスから構造化知識を抽出するためのユーザフレンドリーでスケーラブルな知識グラフ構築(kgc)システムを設計する。
既存のKGCシステムとは異なり、gBuilderはIEモデルの迅速な開発を受け入れるためのフレキシブルでユーザ定義のパイプラインを提供する。
テンプレートベースの、あるいはヒューリスティックなオペレータやプログラマブルなオペレータは、さまざまなドメインのデータに適応することができる。
さらに,クラウドベースのgbuilderの自己適応型タスクスケジューリングも設計し,大規模ナレッジグラフ構築におけるスケーラビリティを確保する。
実験により,gBuilderが一様プラットフォームにおける知識グラフ構築のための複数の情報抽出モデルを編成できるだけでなく,大規模KGCタスクにおける高いスケーラビリティも確認できた。
関連論文リスト
- StructLM: Towards Building Generalist Models for Structured Knowledge
Grounding [50.73401326337493]
StructLMは、評価された18のデータセットのうち14のタスク固有のモデルを上回る一連のモデルである。
予測とは対照的に,StructLM-34BはStructLM-7Bよりもわずかに改善されている。
論文 参考訳(メタデータ) (2024-02-26T15:47:01Z) - CONCORD: Towards a DSL for Configurable Graph Code Representation [3.756550107432323]
カスタマイズ可能なグラフ表現を構築するためのドメイン固有言語であるCONCORDを紹介する。
実例として,コードの臭い検出に有効であることを示す。
ConCORDは、研究者がカスタマイズ可能なグラフベースのコード表現を作成し、実験するのに役立つ。
論文 参考訳(メタデータ) (2024-01-31T16:16:48Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - An Open-Source Knowledge Graph Ecosystem for the Life Sciences [5.665519167428707]
PheKnowLatorは、存在論的基盤を持つ知識グラフの構築を自動化するセマンティックエコシステムである。
エコシステムには、KG構築リソース、分析ツール、ベンチマークが含まれている。
PheKnowLatorは、パフォーマンスやユーザビリティを損なうことなく、完全にカスタマイズ可能なKGを可能にする。
論文 参考訳(メタデータ) (2023-07-11T18:55:09Z) - Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-modal
Structured Representations [70.41385310930846]
マルチモーダルな構造表現を強化するためのエンドツーエンドフレームワークであるStructure-CLIPを提案する。
シーングラフを用いてセマンティックなネガティブな例の構築をガイドし、その結果、構造化された表現の学習に重点を置いている。
知識エンハンス(KEE)は、SGKを入力として活用し、構造化表現をさらに強化するために提案される。
論文 参考訳(メタデータ) (2023-05-06T03:57:05Z) - LasUIE: Unifying Information Extraction with Latent Adaptive
Structure-aware Generative Language Model [96.889634747943]
全ての典型的な情報抽出タスク(UIE)を1つの生成言語モデル(GLM)で普遍的にモデル化し、大きな可能性を明らかにした。
UIE のための構文知識のパワーを完全に解放する構造対応 GLM を提案する。
7つのタスクにわたるIEベンチマークが12以上あり、私たちのシステムはベースラインのUIEシステムよりも大幅に改善されていることを示しています。
論文 参考訳(メタデータ) (2023-04-13T04:01:14Z) - PDSketch: Integrated Planning Domain Programming and Learning [86.07442931141637]
我々は PDSketch という新しいドメイン定義言語を提案する。
これにより、ユーザーはトランジションモデルで柔軟にハイレベルな構造を定義できる。
移行モデルの詳細は、トレーニング可能なニューラルネットワークによって満たされる。
論文 参考訳(メタデータ) (2023-03-09T18:54:12Z) - KG-Hub -- Building and Exchanging Biological Knowledge Graphs [0.5369297590461578]
KG-Hubは知識グラフの標準化された構築、交換、再利用を可能にするプラットフォームである。
現在のKG-Hubプロジェクトは、新型コロナウイルス研究、薬物再精製、微生物-環境相互作用、希少疾患研究などのユースケースにまたがっている。
論文 参考訳(メタデータ) (2023-01-31T21:29:35Z) - Schema-aware Reference as Prompt Improves Data-Efficient Knowledge Graph
Construction [57.854498238624366]
本稿では,データ効率のよい知識グラフ構築のためのRAP(Schema-Aware Reference As Prompt)の検索手法を提案する。
RAPは、人間の注釈付きおよび弱教師付きデータから受け継いだスキーマと知識を、各サンプルのプロンプトとして動的に活用することができる。
論文 参考訳(メタデータ) (2022-10-19T16:40:28Z) - SLAPS: Self-Supervision Improves Structure Learning for Graph Neural
Networks [14.319159694115655]
本稿では,自己超越によるグラフ構造推定のためのより監督的な手法として,自己超越による適応学習とGNNパラメータの同時学習(SLAPS)を提案する。
包括的な実験的研究により、SLAPSは数十万のノードを持つ大きなグラフにスケールし、確立されたベンチマーク上でタスク固有のグラフ構造を学ぶために提案されたいくつかのモデルより優れていることが示された。
論文 参考訳(メタデータ) (2021-02-09T18:56:01Z) - KGTK: A Toolkit for Large Knowledge Graph Manipulation and Analysis [9.141014703209494]
KGTKは、KGを表現、生成、変換、拡張、分析するために設計されたデータサイエンス中心のツールキットである。
我々はKGTKを使ってWikidataやDBpedia、ConceptNetといった大規模なKGを統合・操作する現実世界のシナリオでこのフレームワークを説明します。
論文 参考訳(メタデータ) (2020-05-29T21:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。