論文の概要: GenIE: Generative Information Extraction
- arxiv url: http://arxiv.org/abs/2112.08340v1
- Date: Wed, 15 Dec 2021 18:45:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-16 13:10:30.454777
- Title: GenIE: Generative Information Extraction
- Title(参考訳): GenIE: 生成情報抽出
- Authors: Martin Josifoski, Nicola De Cao, Maxime Peyrard, Robert West
- Abstract要約: 我々は,閉じた情報抽出のエンドツーエンド自動回帰式であるGenIEを紹介する。
実験の結果,GenIEはクローズド情報抽出の最先端技術であることがわかった。
この研究は、情報抽出のコアタスクに対する統一されたエンドツーエンドアプローチへの道を開いた。
- 参考スコア(独自算出の注目度): 20.491645841368214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Structured and grounded representation of text is typically formalized by
closed information extraction, the problem of extracting an exhaustive set of
(subject, relation, object) triplets that are consistent with a predefined set
of entities and relations from a knowledge base schema. Most existing works are
pipelines prone to error accumulation, and all approaches are only applicable
to unrealistically small numbers of entities and relations. We introduce GenIE
(generative information extraction), the first end-to-end autoregressive
formulation of closed information extraction. GenIE naturally exploits the
language knowledge from the pre-trained transformer by autoregressively
generating relations and entities in textual form. Thanks to a new bi-level
constrained generation strategy, only triplets consistent with the predefined
knowledge base schema are produced. Our experiments show that GenIE is
state-of-the-art on closed information extraction, generalizes from fewer
training data points than baselines, and scales to a previously unmanageable
number of entities and relations. With this work, closed information extraction
becomes practical in realistic scenarios, providing new opportunities for
downstream tasks. Finally, this work paves the way towards a unified end-to-end
approach to the core tasks of information extraction. Code and models available
at https://github.com/epfl-dlab/GenIE.
- Abstract(参考訳): テキストの構造的および接地的表現は、一般に、知識ベーススキーマから予め定義されたエンティティの集合と関係の集合と整合した(対象、関係、対象)三重項の完全な集合を抽出する問題である閉情報抽出によって定式化される。
既存の作業の多くはパイプラインでエラーの蓄積が難しく、すべてのアプローチは非現実的に少数のエンティティや関係にのみ適用できる。
閉鎖情報抽出の最初のエンドツーエンド自動回帰式であるGenIE(生成情報抽出)を紹介する。
GenIEは、テキスト形式で関係やエンティティを自動回帰生成することで、事前訓練されたトランスフォーマーから言語知識を自然に活用する。
新しいbiレベルの制約付き生成戦略により、事前定義された知識ベーススキーマに準拠したトリプレットのみが生成される。
我々の実験は、GenIEがクローズド情報抽出の最先端であり、ベースラインよりも少ないトレーニングデータポイントから一般化し、これまで管理不能だったエンティティとリレーションシップにスケールすることを示した。
この作業により、クローズド情報抽出は現実的なシナリオにおいて実践的になり、下流タスクに新たな機会を提供する。
最後に、この研究は情報抽出のコアタスクへの統一的なエンドツーエンドアプローチへの道を開く。
コードとモデルはhttps://github.com/epfl-dlab/genieで入手できる。
関連論文リスト
- Inference over Unseen Entities, Relations and Literals on Knowledge Graphs [1.7474352892977463]
知識グラフ埋め込みモデルは、様々な課題に対処するために、トランスダクティブな設定でうまく適用されている。
本稿では、エンティティとリレーションのバイトペアエンコードされたサブワード単位のシーケンスから三重埋め込みを構築するための注意的バイトペアエンコーディング層(BytE)を提案する。
BytEは、知識グラフの埋め込みモデルに、エンティティやリレーションではなくサブワード単位の埋め込みを学習させるため、重み付けによる大規模な機能の再利用につながる。
論文 参考訳(メタデータ) (2024-10-09T10:20:54Z) - Distantly Supervised Morpho-Syntactic Model for Relation Extraction [0.27195102129094995]
テキストから制約のない関係の集合を抽出し分類する手法を提案する。
ウィキデータとウィキペディア上に構築された6つのデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2024-01-18T14:17:40Z) - ASPER: Answer Set Programming Enhanced Neural Network Models for Joint
Entity-Relation Extraction [11.049915720093242]
本稿では ASP-enhanced Entity-Relation extract (ASPER) という新しいアプローチを提案する。
ASPERは、データとドメインの知識の両方から学習することで、エンティティと関係を共同で認識する。
特に、ASPERはニューラルネットワークモデルの学習プロセスにおいて、事実知識(ASPで事実として表現される)と派生知識(ASPで規則として表現される)を活用する。
論文 参考訳(メタデータ) (2023-05-24T17:32:58Z) - Zero-shot Triplet Extraction by Template Infilling [13.295751492744081]
Triplet extractは、非構造化テキストからエンティティのペアとその対応する関係を抽出することを目的としている。
予め訓練された言語モデル (LM) 上で三重項抽出をテンプレート埋め込みタスクに還元することにより, 抽出モデルにゼロショット学習機能を持たせることができることを示す。
生成変換器の事前学習目標にタスク目標を整合させる新しいフレームワークZETTを提案し,未知の関係を一般化する。
論文 参考訳(メタデータ) (2022-12-21T00:57:24Z) - Grounded Keys-to-Text Generation: Towards Factual Open-Ended Generation [92.1582872870226]
そこで我々は,新しい接地型キー・ツー・テキスト生成タスクを提案する。
タスクは、ガイドキーと接地パスのセットが与えられたエンティティに関する事実記述を生成することである。
近年のQAに基づく評価手法に着想を得て,生成した記述の事実的正当性を示す自動計量MAFEを提案する。
論文 参考訳(メタデータ) (2022-12-04T23:59:41Z) - DORE: Document Ordered Relation Extraction based on Generative Framework [56.537386636819626]
本稿では,既存のDocREモデルの根本原因について検討する。
本稿では,モデルが学習しやすく,決定論的な関係行列から記号列と順序列を生成することを提案する。
4つのデータセットに対する実験結果から,提案手法は生成型DocREモデルの性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2022-10-28T11:18:10Z) - Schema-aware Reference as Prompt Improves Data-Efficient Knowledge Graph
Construction [57.854498238624366]
本稿では,データ効率のよい知識グラフ構築のためのRAP(Schema-Aware Reference As Prompt)の検索手法を提案する。
RAPは、人間の注釈付きおよび弱教師付きデータから受け継いだスキーマと知識を、各サンプルのプロンプトとして動的に活用することができる。
論文 参考訳(メタデータ) (2022-10-19T16:40:28Z) - RelationPrompt: Leveraging Prompts to Generate Synthetic Data for
Zero-Shot Relation Triplet Extraction [65.4337085607711]
ゼロショット関係トリプルト抽出(ZeroRTE)のタスク設定について紹介する。
入力文が与えられた後、抽出された各三重項は、トレーニング段階で関係ラベルが見えないヘッドエンティティ、リレーションラベル、テールエンティティから構成される。
本稿では、言語モデルに構造化テキストを生成するよう促すことで、関係例を合成する。
論文 参考訳(メタデータ) (2022-03-17T05:55:14Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z) - Generative Adversarial Zero-Shot Relational Learning for Knowledge
Graphs [96.73259297063619]
我々は、この厄介なキュレーションを解放するために、新しい定式化、ゼロショット学習を考える。
新たに追加された関係について,テキスト記述から意味的特徴を学習しようと試みる。
我々は,GAN(Generative Adrial Networks)を活用し,テキストと知識グラフ領域の接続を確立する。
論文 参考訳(メタデータ) (2020-01-08T01:19:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。