論文の概要: GENEVA: Pushing the Limit of Generalizability for Event Argument
Extraction with 100+ Event Types
- arxiv url: http://arxiv.org/abs/2205.12505v1
- Date: Wed, 25 May 2022 05:46:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-26 13:55:34.799185
- Title: GENEVA: Pushing the Limit of Generalizability for Event Argument
Extraction with 100+ Event Types
- Title(参考訳): geneva: 100以上のイベント型によるイベント引数抽出のための一般化可能性の限界を押し上げる
- Authors: Tanmay Parekh, I-Hung Hsu, Kuan-Hao Huang, Kai-Wei Chang, Nanyun Peng
- Abstract要約: Event Argument extract (EAE)は、自然言語テキストからイベント固有の情報を抽出するタスクを扱う。
ACEやEREのような既存のベンチマークデータセットのほとんどは、イベントに関して限定的なカバレッジを持っている。
多様な115のイベントと187の引数ロールをカバーする新しいデータセットを導入する。
- 参考スコア(独自算出の注目度): 77.05288144035056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Numerous events occur worldwide and are documented in the news, social media,
and various online platforms in raw text. Extracting useful and succinct
information about these events is crucial to various downstream applications.
Event Argument Extraction (EAE) deals with the task of extracting
event-specific information from natural language text. In order to cater to new
events and domains in a realistic low-data setting, there is a growing urgency
for EAE models to be generalizable. Consequentially, there is a necessity for
benchmarking setups to evaluate the generalizability of EAE models. But most
existing benchmarking datasets like ACE and ERE have limited coverage in terms
of events and cannot adequately evaluate the generalizability of EAE models. To
alleviate this issue, we introduce a new dataset GENEVA covering a diverse
range of 115 events and 187 argument roles. Using this dataset, we create four
benchmarking test suites to assess the model's generalization capability from
different perspectives. We benchmark various representative models on these
test suites and compare their generalizability relatively. Finally, we propose
a new model SCAD that outperforms the previous models and serves as a strong
benchmark for these test suites.
- Abstract(参考訳): 世界中で多くのイベントが発生し、ニュース、ソーシャルメディア、様々なオンラインプラットフォームに生のテキストで文書化されている。
これらのイベントに関する有用かつ簡潔な情報を抽出することは、さまざまなダウンストリームアプリケーションに不可欠である。
Event Argument extract (EAE)は、自然言語テキストからイベント固有の情報を抽出するタスクを扱う。
現実的な低データ設定で新しいイベントやドメインに対処するためには、EAEモデルを一般化する緊急性が高まっている。
結果として、AEモデルの一般化性を評価するために、セットアップをベンチマークする必要がある。
しかし、ACEやEREのような既存のベンチマークデータセットのほとんどは、イベントに関して限定的なカバレッジを持ち、EAEモデルの一般化性を適切に評価することはできない。
この問題を軽減するために,115のイベントと187の引数の役割をカバーする新しいデータセットgenevaを紹介する。
このデータセットを使用して、4つのベンチマークテストスイートを作成し、異なる視点からモデルの一般化能力を評価する。
これらのテストスイート上で様々な代表モデルをベンチマークし、それらの一般化性を相対的に比較する。
最後に,従来のモデルより優れ,これらのテストスイートの強力なベンチマークとして機能する新しいモデルSCADを提案する。
関連論文リスト
- A Structure-aware Generative Model for Biomedical Event Extraction [6.282854894433099]
GenBEEという名前のイベント構造を意識した生成モデルは、バイオメディカルテキストで複雑なイベント構造をキャプチャできる。
我々は3つのバイオメディカルイベント抽出ベンチマークを用いて提案したGenBEEモデルを評価した。
論文 参考訳(メタデータ) (2024-08-13T02:43:19Z) - UniGen: A Unified Framework for Textual Dataset Generation Using Large Language Models [88.16197692794707]
UniGenは、多様で正確で高度に制御可能なデータセットを作成するように設計された包括的なフレームワークである。
データ多様性を強化するため、UniGenは属性誘導生成モジュールとグループチェック機能を備えている。
大規模な実験は、UniGenによって生成されたデータの優れた品質を示す。
論文 参考訳(メタデータ) (2024-06-27T07:56:44Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding Dataset with Event Argument Annotation [104.6065882758648]
MAVEN-Argは、イベント検出、イベント引数抽出、イベント関係抽出をサポートする最初のオールインワンデータセットである。
EAEベンチマークでは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)EAEのすべてのタスク変種をサポートする包括的なアノテーションの3つの利点がある。
論文 参考訳(メタデータ) (2023-11-15T16:52:14Z) - AMPERE: AMR-Aware Prefix for Generation-Based Event Argument Extraction
Model [38.390078345679214]
イベント引数抽出(EAE)は、あるイベントに対するイベント引数とその特定の役割を特定する。
世代ベースAEモデルの最近の進歩は、分類ベースモデルよりも優れた性能と一般化性を示している。
生成モデルのすべての層に対してAMR対応プレフィックスを生成するAMPEREを提案する。
論文 参考訳(メタデータ) (2023-05-26T08:38:25Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z) - Rethinking Generalization of Neural Models: A Named Entity Recognition
Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。
詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。
本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文 参考訳(メタデータ) (2020-01-12T04:33:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。