論文の概要: Explicit, Implicit, and Scattered: Revisiting Event Extraction to Capture Complex Arguments
- arxiv url: http://arxiv.org/abs/2410.03594v1
- Date: Fri, 4 Oct 2024 16:54:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 21:08:10.558810
- Title: Explicit, Implicit, and Scattered: Revisiting Event Extraction to Capture Complex Arguments
- Title(参考訳): Explicit, Implicit, Scattered: 複雑な引数のキャプチャへのイベント抽出の再検討
- Authors: Omar Sharif, Joseph Gatto, Madhusudan Basak, Sarah M. Preum,
- Abstract要約: 先行研究は、イベント固有の引数の抽出をスパン抽出問題として定式化する。
既存のEEフレームワークではモデル化できない2つの重要な引数タイプを紹介します。
オンライン健康談話から7,464の論証アノテーションを含む新しいデータセットであるDiscourseEEを開発した。
- 参考スコア(独自算出の注目度): 1.9820694575112385
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Prior works formulate the extraction of event-specific arguments as a span extraction problem, where event arguments are explicit -- i.e. assumed to be contiguous spans of text in a document. In this study, we revisit this definition of Event Extraction (EE) by introducing two key argument types that cannot be modeled by existing EE frameworks. First, implicit arguments are event arguments which are not explicitly mentioned in the text, but can be inferred through context. Second, scattered arguments are event arguments that are composed of information scattered throughout the text. These two argument types are crucial to elicit the full breadth of information required for proper event modeling. To support the extraction of explicit, implicit, and scattered arguments, we develop a novel dataset, DiscourseEE, which includes 7,464 argument annotations from online health discourse. Notably, 51.2% of the arguments are implicit, and 17.4% are scattered, making DiscourseEE a unique corpus for complex event extraction. Additionally, we formulate argument extraction as a text generation problem to facilitate the extraction of complex argument types. We provide a comprehensive evaluation of state-of-the-art models and highlight critical open challenges in generative event extraction. Our data and codebase are available at https://omar-sharif03.github.io/DiscourseEE.
- Abstract(参考訳): 先行研究は、イベント固有の引数の抽出をスパン抽出問題として定式化している。
本研究では、既存のEEフレームワークでモデル化できない2つの主要な引数タイプを導入することで、イベント抽出(EE)の定義を再考する。
まず、暗黙の引数は、テキストで明示的に言及されていないが、コンテキストを通して推論できるイベント引数である。
第二に、散在する引数は、テキスト全体に散在する情報からなるイベント引数である。
これら2つの引数タイプは、適切なイベントモデリングに必要な全情報を引き出すために不可欠である。
明示的,暗黙的,散在的な議論の抽出を支援するために,オンライン健康談話から7,464の論証アノテーションを含む新しいデータセットであるDiscourseEEを開発した。
特に51.2%が暗黙的であり、17.4%が散在しており、DiscourseEEは複雑なイベント抽出のためのユニークなコーパスとなっている。
さらに、テキスト生成問題として引数抽出を定式化し、複雑な引数型の抽出を容易にする。
我々は、最先端モデルの総合的な評価を行い、生成イベント抽出における重要なオープン課題を明らかにする。
私たちのデータとコードベースはhttps://omar-sharif03.github.io/DiscourseEEで公開されています。
関連論文リスト
- MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding Dataset with Event Argument Annotation [104.6065882758648]
MAVEN-Argは、イベント検出、イベント引数抽出、イベント関係抽出をサポートする最初のオールインワンデータセットである。
EAEベンチマークでは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)EAEのすべてのタスク変種をサポートする包括的なアノテーションの3つの利点がある。
論文 参考訳(メタデータ) (2023-11-15T16:52:14Z) - Global Constraints with Prompting for Zero-Shot Event Argument
Classification [49.84347224233628]
我々は、アノテーションやタスク固有のトレーニングを使わずに、イベント引数の分類に取り組むよう促すことで、グローバルな制約を利用することを提案する。
事前訓練された言語モデルは、新しいパスをスコアし、最初の予測を行う。
私たちの新しいプロンプトテンプレートは、手作業なしで、すべてのイベントや引数タイプに簡単に適応できます。
論文 参考訳(メタデータ) (2023-02-09T06:39:29Z) - Retrieval-Augmented Generative Question Answering for Event Argument
Extraction [66.24622127143044]
イベント引数抽出のための検索拡張生成QAモデル(R-GQA)を提案する。
最も類似したQAペアを検索し、現在の例のコンテキストへのプロンプトとして拡張し、引数を回答としてデコードする。
提案手法は, 様々な設定において, かなり先行した手法より優れている。
論文 参考訳(メタデータ) (2022-11-14T02:00:32Z) - EventGraph: Event Extraction as Semantic Graph Parsing [5.21480688623047]
イベント抽出には、イベントトリガとそれに対応するイベント引数の両方の検出と抽出が含まれる。
イベントをグラフとしてエンコードするイベント抽出のための共同フレームワークであるEventGraphを提案する。
私たちのコードとモデルはオープンソースとしてリリースされています。
論文 参考訳(メタデータ) (2022-10-16T22:11:46Z) - Dynamic Global Memory for Document-level Argument Extraction [63.314514124716936]
文書レベルのイベント引数抽出のための,新しいグローバルなニューラルジェネレーションベースのフレームワークを提案する。
文書メモリストアを使用してコンテキストイベント情報を記録し、それを暗黙的に明示的に活用することで、後のイベントの引数の復号に役立ちます。
実験結果から,我々のフレームワークは従来の手法よりも大幅に優れていたことが判明した。
論文 参考訳(メタデータ) (2022-09-18T23:45:25Z) - Query and Extract: Refining Event Extraction as Type-oriented Binary
Decoding [51.57864297948228]
本稿では,自然言語クエリとしてイベントタイプと引数ロールを取り入れた新しいイベント抽出フレームワークを提案する。
我々のフレームワークは、イベントタイプや引数ロールと入力テキストとのセマンティックな相関をよりよく捉えるための注意機構の恩恵を受ける。
論文 参考訳(メタデータ) (2021-10-14T15:49:40Z) - Capturing Event Argument Interaction via A Bi-Directional Entity-Level
Recurrent Decoder [7.60457018063735]
イベント引数抽出(EAE)をSeq2Seqライクな学習問題として初めて定式化する。
新たな双方向エンティティレベルリカレントデコーダ(BERD)を用いたニューラルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-07-01T02:55:12Z) - Reinforcement Learning-based Dialogue Guided Event Extraction to Exploit
Argument Relations [70.35379323231241]
本稿では、イベント引数の関係を明示的に活用することで、イベント抽出のためのより良いアプローチを提案する。
我々は増補学習と漸進学習を用いて、多回反復的なプロセスを通じて複数の引数を抽出する。
実験の結果,提案手法は7つの最先端イベント抽出法より一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2021-06-23T13:24:39Z) - Event Argument Extraction using Causal Knowledge Structures [9.56216681584111]
イベント引数抽出とは、特定のイベントのために構造化されていないテキストから構造化情報を抽出するタスクを指します。
既存の作業のほとんどは、このタスクを文レベルでモデル化し、コンテキストをローカルスコープに制限する。
複雑なイベント引数の抽出を支援するために,ドキュメントレベルのイベント情報を注入する外部知識支援アプローチを提案する。
論文 参考訳(メタデータ) (2021-05-02T13:59:07Z) - Resource-Enhanced Neural Model for Event Argument Extraction [28.812507794694543]
イベント引数抽出は、イベントの引数を特定し、それらの引数が果たす役割を分類することを目的としている。
本稿では,複数種類のトリガ依存シーケンス表現を持つトリガ対応シーケンスエンコーダを提案する。
ACE2005ベンチマーク実験により,本手法が新たな最先端技術を実現することを示す。
論文 参考訳(メタデータ) (2020-10-06T21:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。