論文の概要: LOKE: Linked Open Knowledge Extraction for Automated Knowledge Graph
Construction
- arxiv url: http://arxiv.org/abs/2311.09366v1
- Date: Wed, 15 Nov 2023 20:57:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 17:43:13.687092
- Title: LOKE: Linked Open Knowledge Extraction for Automated Knowledge Graph
Construction
- Title(参考訳): LOKE:知識グラフ構築のためのリンク付きオープン知識抽出
- Authors: Jamie McCusker
- Abstract要約: Wikidataナレッジグラフを用いた知識グラフ構築において,GPTモデルの利用とエンジニアリングの促進について検討する。
我々は,AllenAI の OpenIE 4 実装をOKE タスクで上回る,素直なエンティティリンク手法 (LOKE-GPT と呼ぶ) と組み合わせた,十分に設計されたプロンプトが,AllenAI の OpenIE 4 実装より優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While the potential of Open Information Extraction (Open IE) for Knowledge
Graph Construction (KGC) may seem promising, we find that the alignment of Open
IE extraction results with existing knowledge graphs to be inadequate. The
advent of Large Language Models (LLMs), especially the commercially available
OpenAI models, have reset expectations for what is possible with deep learning
models and have created a new field called prompt engineering. We investigate
the use of GPT models and prompt engineering for knowledge graph construction
with the Wikidata knowledge graph to address a similar problem to Open IE,
which we call Open Knowledge Extraction (OKE) using an approach we call the
Linked Open Knowledge Extractor (LOKE, pronounced like "Loki"). We consider the
entity linking task essential to construction of real world knowledge graphs.
We merge the CaRB benchmark scoring approach with data from the TekGen dataset
for the LOKE task. We then show that a well engineered prompt, paired with a
naive entity linking approach (which we call LOKE-GPT), outperforms AllenAI's
OpenIE 4 implementation on the OKE task, although it over-generates triples
compared to the reference set due to overall triple scarcity in the TekGen set.
Through an analysis of entity linkability in the CaRB dataset, as well as
outputs from OpenIE 4 and LOKE-GPT, we see that LOKE-GPT and the "silver"
TekGen triples show that the task is significantly different in content from
OIE, if not structure. Through this analysis and a qualitative analysis of
sentence extractions via all methods, we found that LOKE-GPT extractions are of
high utility for the KGC task and suitable for use in semi-automated extraction
settings.
- Abstract(参考訳): 知識グラフ構築のためのオープン情報抽出(Open IE)の可能性は期待できるかもしれないが,既存の知識グラフとOpen IE抽出結果の整合性は不十分である。
大規模言語モデル(llm)の出現、特に商用利用可能なopenaiモデルは、ディープラーニングモデルで可能となるものに対する期待を再認識し、prompt engineeringと呼ばれる新しい分野を生み出した。
Wikidataナレッジグラフを用いた知識グラフ構築のためのGPTモデルの利用について検討し,オープン知識抽出(OKE)と呼ばれるオープン知識抽出(LOKE, Linked Open Knowledge Extractor)のアプローチを用いて,オープンIEと類似の問題に対処する。
実世界の知識グラフ構築に不可欠なエンティティリンクタスクについて考察する。
LOKEタスクのためのTekGenデータセットのデータとCaRBベンチマークスコアリングアプローチをマージする。
すると、うまく設計されたプロンプトが(我々がloke-gptと呼ぶ)ナイーブなエンティティリンクアプローチと組み合わせると、オケタスクでallenaiのopenie 4の実装よりも優れていることが分かる。
CaRBデータセットのエンティティ結合性の解析とOpenIE 4 と LOKE-GPT の出力から,LOKE-GPT と "銀" TekGen のトリプルは,構造化されていない場合,そのタスクが OIE のコンテンツと大きく異なることを示している。
この分析と全ての方法による文抽出の質的分析により,loke-gpt抽出はkgcタスクに高い有用性を持ち,半自動抽出に適することがわかった。
関連論文リスト
- An Automatic Graph Construction Framework based on Large Language Models for Recommendation [49.51799417575638]
本稿では,大規模言語モデルに基づく自動グラフ構築フレームワークであるAutoGraphを紹介する。
LLMはユーザ好みとアイテムの知識を推論し、セマンティックベクターとして符号化する。
潜在因子は、ユーザ/イテムノードをリンクする余分なノードとして組み込まれ、結果として、深いグローバルビューセマンティクスを持つグラフとなる。
論文 参考訳(メタデータ) (2024-12-24T07:51:29Z) - Graphusion: A RAG Framework for Knowledge Graph Construction with a Global Perspective [13.905336639352404]
この研究は、無料テキストからゼロショットの知識グラフフレームワークであるGraphusionを導入している。
ステップ1では、トピックモデリングを用いてシードエンティティのリストを抽出し、最終KGに最も関連性の高いエンティティを導く。
ステップ2ではLSMを用いて候補三重項抽出を行い、ステップ3では抽出した知識のグローバルなビューを提供する新しい融合モジュールを設計する。
論文 参考訳(メタデータ) (2024-10-23T06:54:03Z) - Combining Language and Graph Models for Semi-structured Information
Extraction on the Web [7.44454462555094]
本稿では,共同グラフと言語モデル構造に基づくオープンドメイン情報抽出手法であるGraphScholarBERTを提案する。
実験の結果、GraphScholarBERTはゼロショットドメインとゼロショットWebサイト設定での以前の作業と比較して、F1スコアの抽出を最大34.8%改善できることがわかった。
論文 参考訳(メタデータ) (2024-02-21T20:53:29Z) - Instruct and Extract: Instruction Tuning for On-Demand Information
Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。
InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。
InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文 参考訳(メタデータ) (2023-10-24T17:54:25Z) - Text-Augmented Open Knowledge Graph Completion via Pre-Trained Language
Models [53.09723678623779]
本稿では,高品質なクエリプロンプトを自動的に生成し,大規模テキストコーパスからサポート情報を取得するためのTAGREALを提案する。
その結果、TAGREALは2つのベンチマークデータセット上で最先端のパフォーマンスを達成することがわかった。
TAGREALは、限られたトレーニングデータであっても、既存の埋め込みベース、グラフベース、およびPLMベースの手法よりも優れた性能を有することが判明した。
論文 参考訳(メタデータ) (2023-05-24T22:09:35Z) - UniEX: An Effective and Efficient Framework for Unified Information
Extraction via a Span-extractive Perspective [11.477764739452702]
本稿では,任意のスキーマフォーマットと互換性のあるユニバーサル情報抽出(IE)のための新しいパラダイムを提案する。
提案手法では,テキストベースのIEタスクをトークンペア問題として変換し,すべての抽出対象を均一に分解する。
実験結果から,Unix は生成的ユニバーサル IE モデルよりも性能と推論速度が優れていることが示された。
論文 参考訳(メタデータ) (2023-05-17T15:44:12Z) - MORE: A Metric Learning Based Framework for Open-domain Relation
Extraction [25.149590577718996]
オープンリレーション抽出(OpenRE)は、オープンドメインコーパスからリレーションスキームを抽出するタスクである。
我々はMORE(Metric Learning-based Open Relation extract)という新しい学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-01T07:51:20Z) - OpenIE6: Iterative Grid Labeling and Coordination Analysis for Open
Information Extraction [36.439047786561396]
我々は,OpenIEの新たな技術状態を確立しつつ,10倍高速に抽出する反復ラベリングシステムを提案する。
これは、OpenIEを2Dグリッドラベリングタスクとして扱うIGL(Iterative Grid Labeling)アーキテクチャによって実現される。
当社のOpenIEシステムであるOpenIE6は、F1で4 ptsの速さで以前のシステムを打ち負かしています。
論文 参考訳(メタデータ) (2020-10-07T04:05:37Z) - KILT: a Benchmark for Knowledge Intensive Language Tasks [102.33046195554886]
知識集約型言語タスク(KILT)のベンチマークを示す。
KILTのすべてのタスクはウィキペディアのスナップショットと同じだ。
共有密度ベクトル指数とSeq2seqモデルとの結合が強いベースラインであることが分かる。
論文 参考訳(メタデータ) (2020-09-04T15:32:19Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。