論文の概要: gBuilder: A Scalable Knowledge Graph Construction System for
Unstructured Corpus
- arxiv url: http://arxiv.org/abs/2208.09705v1
- Date: Sat, 20 Aug 2022 15:07:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 12:58:27.202726
- Title: gBuilder: A Scalable Knowledge Graph Construction System for
Unstructured Corpus
- Title(参考訳): 非構造化コーパスのためのスケーラブルな知識グラフ構築システムgbuilder
- Authors: Yanzeng Li, Lei Zou
- Abstract要約: 我々は,構造化されていないコーパスから構造化知識を抽出する,ユーザフレンドリでスケーラブルな知識グラフ構築システム(KGC)を設計する。
gBuilderは、IEモデルの迅速な開発を取り入れた、フレキシブルでユーザ定義のパイプラインを提供する。
また,大規模知識グラフ構築におけるスケーラビリティを確保するために,gBuilderのためのクラウドベースの自己適応型タスクスケジューリングを設計する。
- 参考スコア(独自算出の注目度): 11.374986017876997
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We design a user-friendly and scalable knowledge graph construction (KGC)
system for extracting structured knowledge from the unstructured corpus.
Different from existing KGC systems, gBuilder provides a flexible and
user-defined pipeline to embracing the rapid development of IE models. More
built-in template-based or heuristic operators and programmable operators are
available for adapting to data from different domains. Furthermore, we also
design a cloud-based self-adaptive task scheduling for gBuilder to ensure its
scalability on large-scale knowledge graph construction. Experimental
evaluation not only demonstrates the ability of gBuilder to organize multiple
information extraction models for knowledge graph construction in a uniform
platform, and also confirms its high scalability on large-scale KGC task.
- Abstract(参考訳): 非構造化コーパスから構造化知識を抽出するためのユーザフレンドリーでスケーラブルな知識グラフ構築(kgc)システムを設計する。
既存のKGCシステムとは異なり、gBuilderはIEモデルの迅速な開発を受け入れるためのフレキシブルでユーザ定義のパイプラインを提供する。
テンプレートベースの、あるいはヒューリスティックなオペレータやプログラマブルなオペレータは、さまざまなドメインのデータに適応することができる。
さらに,クラウドベースのgbuilderの自己適応型タスクスケジューリングも設計し,大規模ナレッジグラフ構築におけるスケーラビリティを確保する。
実験により,gBuilderが一様プラットフォームにおける知識グラフ構築のための複数の情報抽出モデルを編成できるだけでなく,大規模KGCタスクにおける高いスケーラビリティも確認できた。
関連論文リスト
- Customized Information and Domain-centric Knowledge Graph Construction with Large Language Models [0.0]
本稿では,構造化情報へのタイムリーなアクセスを実現するための知識グラフに基づく新しいアプローチを提案する。
本フレームワークは,情報検索,キーフレーズ抽出,セマンティックネットワーク生成,トピックマップ可視化などを含むテキストマイニングプロセスを含む。
当社の方法論を自動車電気システムの領域に適用して,スケーラブルなアプローチを実証する。
論文 参考訳(メタデータ) (2024-09-30T07:08:28Z) - Learning to Model Graph Structural Information on MLPs via Graph Structure Self-Contrasting [50.181824673039436]
本稿では,グラフ構造情報をメッセージパッシングなしで学習するグラフ構造自己コントラスト(GSSC)フレームワークを提案する。
提案するフレームワークは,構造情報を事前知識として暗黙的にのみ組み込む,MLP(Multi-Layer Perceptrons)に基づいている。
これはまず、近傍の潜在的非形式的あるいはノイズの多いエッジを取り除くために構造的スペーシングを適用し、その後、スペーシングされた近傍で構造的自己コントラストを行い、ロバストなノード表現を学ぶ。
論文 参考訳(メタデータ) (2024-09-09T12:56:02Z) - KGValidator: A Framework for Automatic Validation of Knowledge Graph Construction [2.9526207670430384]
生成モデルを用いて知識グラフを検証する場合に,一貫性と検証のためのフレームワークを導入する。
この設計は適応と拡張が容易で、どんなグラフ構造化データでも検証することができる。
論文 参考訳(メタデータ) (2024-04-24T15:27:25Z) - CONCORD: Towards a DSL for Configurable Graph Code Representation [3.756550107432323]
カスタマイズ可能なグラフ表現を構築するためのドメイン固有言語であるCONCORDを紹介する。
実例として,コードの臭い検出に有効であることを示す。
ConCORDは、研究者がカスタマイズ可能なグラフベースのコード表現を作成し、実験するのに役立つ。
論文 参考訳(メタデータ) (2024-01-31T16:16:48Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - An Open-Source Knowledge Graph Ecosystem for the Life Sciences [5.665519167428707]
PheKnowLatorは、存在論的基盤を持つ知識グラフの構築を自動化するセマンティックエコシステムである。
エコシステムには、KG構築リソース、分析ツール、ベンチマークが含まれている。
PheKnowLatorは、パフォーマンスやユーザビリティを損なうことなく、完全にカスタマイズ可能なKGを可能にする。
論文 参考訳(メタデータ) (2023-07-11T18:55:09Z) - Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-modal
Structured Representations [70.41385310930846]
マルチモーダルな構造表現を強化するためのエンドツーエンドフレームワークであるStructure-CLIPを提案する。
シーングラフを用いてセマンティックなネガティブな例の構築をガイドし、その結果、構造化された表現の学習に重点を置いている。
知識エンハンス(KEE)は、SGKを入力として活用し、構造化表現をさらに強化するために提案される。
論文 参考訳(メタデータ) (2023-05-06T03:57:05Z) - LasUIE: Unifying Information Extraction with Latent Adaptive
Structure-aware Generative Language Model [96.889634747943]
全ての典型的な情報抽出タスク(UIE)を1つの生成言語モデル(GLM)で普遍的にモデル化し、大きな可能性を明らかにした。
UIE のための構文知識のパワーを完全に解放する構造対応 GLM を提案する。
7つのタスクにわたるIEベンチマークが12以上あり、私たちのシステムはベースラインのUIEシステムよりも大幅に改善されていることを示しています。
論文 参考訳(メタデータ) (2023-04-13T04:01:14Z) - PDSketch: Integrated Planning Domain Programming and Learning [86.07442931141637]
我々は PDSketch という新しいドメイン定義言語を提案する。
これにより、ユーザーはトランジションモデルで柔軟にハイレベルな構造を定義できる。
移行モデルの詳細は、トレーニング可能なニューラルネットワークによって満たされる。
論文 参考訳(メタデータ) (2023-03-09T18:54:12Z) - KG-Hub -- Building and Exchanging Biological Knowledge Graphs [0.5369297590461578]
KG-Hubは知識グラフの標準化された構築、交換、再利用を可能にするプラットフォームである。
現在のKG-Hubプロジェクトは、新型コロナウイルス研究、薬物再精製、微生物-環境相互作用、希少疾患研究などのユースケースにまたがっている。
論文 参考訳(メタデータ) (2023-01-31T21:29:35Z) - Schema-aware Reference as Prompt Improves Data-Efficient Knowledge Graph
Construction [57.854498238624366]
本稿では,データ効率のよい知識グラフ構築のためのRAP(Schema-Aware Reference As Prompt)の検索手法を提案する。
RAPは、人間の注釈付きおよび弱教師付きデータから受け継いだスキーマと知識を、各サンプルのプロンプトとして動的に活用することができる。
論文 参考訳(メタデータ) (2022-10-19T16:40:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。