論文の概要: MEE: A Novel Multilingual Event Extraction Dataset
- arxiv url: http://arxiv.org/abs/2211.05955v1
- Date: Fri, 11 Nov 2022 02:01:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 16:05:23.207850
- Title: MEE: A Novel Multilingual Event Extraction Dataset
- Title(参考訳): MEE: 新しい多言語イベント抽出データセット
- Authors: Amir Pouran Ben Veyseh, Javid Ebrahimi, Franck Dernoncourt, and Thien
Huu Nguyen
- Abstract要約: Event extractは、イベント参照とその引数をテキストから認識することを目的としている。
モデルトレーニングと評価のための高品質な多言語EEデータセットの欠如が主な障害となっている。
本稿では,8言語で50万以上のイベントを参照するアノテーションを提供する新しい多言語イベント抽出データセット(EE)を提案する。
- 参考スコア(独自算出の注目度): 62.80569691825534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Event Extraction (EE) is one of the fundamental tasks in Information
Extraction (IE) that aims to recognize event mentions and their arguments
(i.e., participants) from text. Due to its importance, extensive methods and
resources have been developed for Event Extraction. However, one limitation of
current research for EE involves the under-exploration for non-English
languages in which the lack of high-quality multilingual EE datasets for model
training and evaluation has been the main hindrance. To address this
limitation, we propose a novel Multilingual Event Extraction dataset (MEE) that
provides annotation for more than 50K event mentions in 8 typologically
different languages. MEE comprehensively annotates data for entity mentions,
event triggers and event arguments. We conduct extensive experiments on the
proposed dataset to reveal challenges and opportunities for multilingual EE.
- Abstract(参考訳): イベント抽出 (ee) は、テキストからイベントの言及とその引数(つまり参加者)を認識することを目的とした情報抽出 (ie) の基本タスクの1つである。
その重要性から、イベント抽出のための広範な手法とリソースが開発されている。
しかし、現在のEE研究の1つの制限は、モデルトレーニングと評価に高品質な多言語EEデータセットが欠如していることが主な障害となっている非英語言語の探索不足である。
この制限に対処するために,8言語で50K以上のイベント参照に対してアノテーションを提供する新しい多言語イベント抽出データセット(MEE)を提案する。
MEEはエンティティ参照、イベントトリガ、イベント引数のデータを包括的にアノテーションします。
提案するデータセットについて広範な実験を行い,多言語eeの課題と機会を明らかにする。
関連論文リスト
- Grounding Partially-Defined Events in Multimodal Data [61.0063273919745]
部分定義イベントに対するマルチモーダル定式化を導入し、これらのイベントの抽出を3段階スパン検索タスクとしてキャストする。
このタスクのベンチマークであるMultiVENT-Gを提案し,22.8Kのラベル付きイベント中心エンティティを含む,14.5時間の高密度アノテーション付き現在のイベントビデオと1,168のテキストドキュメントからなる。
結果は、イベント理解の抽象的な課題を示し、イベント中心のビデオ言語システムにおける約束を実証する。
論文 参考訳(メタデータ) (2024-10-07T17:59:48Z) - Event Extraction in Basque: Typologically motivated Cross-Lingual Transfer-Learning Analysis [18.25948580496853]
低リソース言語におけるイベント抽出では,言語間移動学習が広く用いられている。
本稿では,ソース言語とターゲット言語との類型的類似性が,言語間移動の性能に与える影響について検討する。
論文 参考訳(メタデータ) (2024-04-09T15:35:41Z) - MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding Dataset with Event Argument Annotation [104.6065882758648]
MAVEN-Argは、イベント検出、イベント引数抽出、イベント関係抽出をサポートする最初のオールインワンデータセットである。
EAEベンチマークでは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)EAEのすべてのタスク変種をサポートする包括的なアノテーションの3つの利点がある。
論文 参考訳(メタデータ) (2023-11-15T16:52:14Z) - MINION: a Large-Scale and Diverse Dataset for Multilingual Event
Detection [65.46122357928041]
Event Detection (ED) は、テキスト中のイベント参照のトリガーワードを識別し、分類するタスクである。
主な疑問は、既存のEDモデルが異なる言語でどれだけうまく機能するか、EDが他の言語でどの程度困難であるか、EDの知識とアノテーションが言語間でどの程度うまく伝達できるかである。
EDのための大規模多言語データセット(MINION)を導入し、8つの異なる言語でのイベントを一貫してアノテートする。
論文 参考訳(メタデータ) (2022-11-11T02:09:51Z) - Title2Event: Benchmarking Open Event Extraction with a Large-scale
Chinese Title Dataset [19.634367718707857]
イベントタイプを制限せずにオープンイベント抽出をベンチマークする大規模文レベルデータセットであるTitle2Eventを提示する。
Title2Eventには42,000以上のニュースタイトルがあり、34のトピックが中国のWebページから集められている。
私たちの知る限りでは、これは現在、オープンイベント抽出のための中国最大の手動注釈付きデータセットである。
論文 参考訳(メタデータ) (2022-11-02T04:39:36Z) - PILED: An Identify-and-Localize Framework for Few-Shot Event Detection [79.66042333016478]
本研究では,事前学習した言語モデルから事象関連知識を引き出すために,クローゼプロンプトを用いた。
型固有のパラメータの数を最小化し、新しい型に対するイベント検出タスクに迅速に適応できるようにします。
論文 参考訳(メタデータ) (2022-02-15T18:01:39Z) - Event Argument Extraction using Causal Knowledge Structures [9.56216681584111]
イベント引数抽出とは、特定のイベントのために構造化されていないテキストから構造化情報を抽出するタスクを指します。
既存の作業のほとんどは、このタスクを文レベルでモデル化し、コンテキストをローカルスコープに制限する。
複雑なイベント引数の抽出を支援するために,ドキュメントレベルのイベント情報を注入する外部知識支援アプローチを提案する。
論文 参考訳(メタデータ) (2021-05-02T13:59:07Z) - Detecting Ongoing Events Using Contextual Word and Sentence Embeddings [110.83289076967895]
本稿では,OED(Ongoing Event Detection)タスクを紹介する。
目的は、歴史、未来、仮説、あるいは新しいものでも現在のものでもない他の形式や出来事に対してのみ、進行中のイベントの言及を検出することである。
構造化されていないテキストから進行中のイベントに関する構造化情報を抽出する必要があるアプリケーションは、OEDシステムを利用することができる。
論文 参考訳(メタデータ) (2020-07-02T20:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。