論文の概要: MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding
Dataset with Event Argument Annotation
- arxiv url: http://arxiv.org/abs/2311.09105v1
- Date: Wed, 15 Nov 2023 16:52:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 15:05:43.281143
- Title: MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding
Dataset with Event Argument Annotation
- Title(参考訳): MAVEN-Arg: イベント引数アノテーションによるオールインワンイベント理解データセットのパズルの補完
- Authors: Xiaozhi Wang, Hao Peng, Yong Guan, Kaisheng Zeng, Jianhui Chen, Lei
Hou, Xu Han, Yankai Lin, Zhiyuan Liu, Ruobing Xie, Jie Zhou, Juanzi Li
- Abstract要約: MAVEN-Argは、イベント検出、イベント引数抽出、イベント関係抽出をサポートする最初のオールインワンデータセットである。
EAEベンチマークでは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)EAEのすべてのタスク変種をサポートする包括的なアノテーションの3つの利点がある。
- 参考スコア(独自算出の注目度): 107.41719717693199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding events in texts is a core objective of natural language
understanding, which requires detecting event occurrences, extracting event
arguments, and analyzing inter-event relationships. However, due to the
annotation challenges brought by task complexity, a large-scale dataset
covering the full process of event understanding has long been absent. In this
paper, we introduce MAVEN-Arg, which augments MAVEN datasets with event
argument annotations, making the first all-in-one dataset supporting event
detection, event argument extraction (EAE), and event relation extraction. As
an EAE benchmark, MAVEN-Arg offers three main advantages: (1) a comprehensive
schema covering 162 event types and 612 argument roles, all with expert-written
definitions and examples; (2) a large data scale, containing 98,591 events and
290,613 arguments obtained with laborious human annotation; (3) the exhaustive
annotation supporting all task variants of EAE, which annotates both entity and
non-entity event arguments in document level. Experiments indicate that
MAVEN-Arg is quite challenging for both fine-tuned EAE models and proprietary
large language models (LLMs). Furthermore, to demonstrate the benefits of an
all-in-one dataset, we preliminarily explore a potential application, future
event prediction, with LLMs. MAVEN-Arg and our code can be obtained from
https://github.com/THU-KEG/MAVEN-Argument.
- Abstract(参考訳): テキストにおけるイベントの理解は、自然言語理解の中心的な目的であり、イベント発生の検出、イベント引数の抽出、イベント間の関係の分析を必要とする。
しかし、タスクの複雑さによって引き起こされるアノテーションの課題のため、イベント理解の全プロセスをカバーする大規模データセットは長い間欠落していた。
本稿では、MAVENデータセットにイベント引数アノテーションを付加し、イベント検出、イベント引数抽出(EAE)、イベント関係抽出をサポートする最初のオールインワンデータセットを作成するMAVEN-Argを紹介する。
EAEベンチマークとして、MAVEN-Argは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)文書レベルでエンティティと非エンティティのイベント引数の両方をアノテートするEAEの全タスク変種をサポートする包括的なアノテーション、の3つの利点を提供している。
実験の結果、MAVEN-Argは細調整されたEAEモデルとプロプライエタリな大規模言語モデル(LLM)の両方でかなり難しいことが示されている。
さらに、オールインワンデータセットの利点を実証するために、LLMによる潜在的なアプリケーション、将来のイベント予測を予備的に検討する。
MAVEN-Argとそのコードはhttps://github.com/THU-KEG/MAVEN-Argumentから取得できます。
関連論文リスト
- MAVEN-Fact: A Large-scale Event Factuality Detection Dataset [55.01875707021496]
我々は,MAVENデータセットに基づく大規模かつ高品質なEFDデータセットであるMAVEN-Factを紹介する。
MAVEN-Factには112,276のイベントのファクトリティアノテーションが含まれており、EFDデータセットとしては最大である。
MAVEN-Factは従来の微調整モデルと大規模言語モデル(LLM)の両方において困難であることを示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-07-22T03:43:46Z) - From Simple to Complex: A Progressive Framework for Document-level
Informative Argument Extraction [34.37013964529546]
イベント引数抽出(EAE)は、単一のドキュメントから複数のイベントの引数を抽出するモデルを必要とする。
文書レベルEAEのための簡易・複雑プログレッシブフレームワークを提案する。
提案手法は,F1 において SOTA を 1.4% 上回る性能を示し,EAE タスクにおいて有用であることを示す。
論文 参考訳(メタデータ) (2023-10-25T04:38:02Z) - MEE: A Novel Multilingual Event Extraction Dataset [62.80569691825534]
Event extractは、イベント参照とその引数をテキストから認識することを目的としている。
モデルトレーニングと評価のための高品質な多言語EEデータセットの欠如が主な障害となっている。
本稿では,8言語で50万以上のイベントを参照するアノテーションを提供する新しい多言語イベント抽出データセット(EE)を提案する。
論文 参考訳(メタデータ) (2022-11-11T02:01:41Z) - GENEVA: Benchmarking Generalizability for Event Argument Extraction with
Hundreds of Event Types and Argument Roles [77.05288144035056]
Event Argument extract (EAE)は、新しいイベントやドメインに対応するためのモデルの一般化性の改善に重点を置いている。
ACEやEREといった標準的なベンチマークデータセットは、40のイベントタイプと25のエンティティ中心の引数ロールをカバーする。
論文 参考訳(メタデータ) (2022-05-25T05:46:28Z) - Event Argument Extraction using Causal Knowledge Structures [9.56216681584111]
イベント引数抽出とは、特定のイベントのために構造化されていないテキストから構造化情報を抽出するタスクを指します。
既存の作業のほとんどは、このタスクを文レベルでモデル化し、コンテキストをローカルスコープに制限する。
複雑なイベント引数の抽出を支援するために,ドキュメントレベルのイベント情報を注入する外部知識支援アプローチを提案する。
論文 参考訳(メタデータ) (2021-05-02T13:59:07Z) - ESTER: A Machine Reading Comprehension Dataset for Event Semantic
Relation Reasoning [49.795767003586235]
イベントセマンティックリレーション推論のための包括的な機械学習理解データセットESTERを紹介します。
もっともよく使われるイベント意味関係を5つ検討し、質問応答タスクとして定式化します。
実験の結果、現在のSOTAシステムは、イベントベースF1、トークンベースF1、HIT@1スコアそれぞれ60.5%、57.8%、76.3%を達成した。
論文 参考訳(メタデータ) (2021-04-16T19:59:26Z) - Unsupervised Label-aware Event Trigger and Argument Classification [73.86358632937372]
まず,利用可能なツール(srlなど)でイベントを識別し,それを事前に定義されたイベントタイプに自動マップする,教師なしイベント抽出パイプラインを提案する。
事前訓練された言語モデルを利用して、イベントトリガと引数の両方の事前定義された型を文脈的に表現します。
我々は、トリガーの83%と引数の54%を正しい型にマッピングし、以前のゼロショットアプローチのパフォーマンスをほぼ倍にしました。
論文 参考訳(メタデータ) (2020-12-30T17:47:24Z) - Document-level Event Extraction with Efficient End-to-end Learning of
Cross-event Dependencies [37.96254956540803]
本稿では,構造化予測アルゴリズムであるDeep Value Networks (DVN) を利用したエンドツーエンドモデルを提案する。
提案手法はACE05上でのCRFモデルに匹敵する性能を達成し,計算効率は極めて高い。
論文 参考訳(メタデータ) (2020-10-24T05:28:16Z) - Resource-Enhanced Neural Model for Event Argument Extraction [28.812507794694543]
イベント引数抽出は、イベントの引数を特定し、それらの引数が果たす役割を分類することを目的としている。
本稿では,複数種類のトリガ依存シーケンス表現を持つトリガ対応シーケンスエンコーダを提案する。
ACE2005ベンチマーク実験により,本手法が新たな最先端技術を実現することを示す。
論文 参考訳(メタデータ) (2020-10-06T21:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。