論文の概要: Title2Event: Benchmarking Open Event Extraction with a Large-scale
Chinese Title Dataset
- arxiv url: http://arxiv.org/abs/2211.00869v1
- Date: Wed, 2 Nov 2022 04:39:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 13:10:56.765888
- Title: Title2Event: Benchmarking Open Event Extraction with a Large-scale
Chinese Title Dataset
- Title(参考訳): Title2Event: 大規模中国ブランドデータセットによるオープンイベント抽出のベンチマーク
- Authors: Haolin Deng, Yanan Zhang, Yangfan Zhang, Wangyang Ying, Changlong Yu,
Jun Gao, Wei Wang, Xiaoling Bai, Nan Yang, Jin Ma, Xiang Chen, Tianhua Zhou
- Abstract要約: イベントタイプを制限せずにオープンイベント抽出をベンチマークする大規模文レベルデータセットであるTitle2Eventを提示する。
Title2Eventには42,000以上のニュースタイトルがあり、34のトピックが中国のWebページから集められている。
私たちの知る限りでは、これは現在、オープンイベント抽出のための中国最大の手動注釈付きデータセットである。
- 参考スコア(独自算出の注目度): 19.634367718707857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Event extraction (EE) is crucial to downstream tasks such as new aggregation
and event knowledge graph construction. Most existing EE datasets manually
define fixed event types and design specific schema for each of them, failing
to cover diverse events emerging from the online text. Moreover, news titles,
an important source of event mentions, have not gained enough attention in
current EE research. In this paper, We present Title2Event, a large-scale
sentence-level dataset benchmarking Open Event Extraction without restricting
event types. Title2Event contains more than 42,000 news titles in 34 topics
collected from Chinese web pages. To the best of our knowledge, it is currently
the largest manually-annotated Chinese dataset for open event extraction. We
further conduct experiments on Title2Event with different models and show that
the characteristics of titles make it challenging for event extraction,
addressing the significance of advanced study on this problem. The dataset and
baseline codes are available at https://open-event-hub.github.io/title2event.
- Abstract(参考訳): イベント抽出(EE)は、新しいアグリゲーションやイベント知識グラフの構築といった下流タスクに不可欠である。
ほとんどの既存のEEデータセットは、手動で固定されたイベントタイプを定義し、それぞれの特定のスキーマを設計します。
さらに、ニュースタイトルはイベントの重要情報源であり、現在のEE研究で十分な注目を集めていない。
本稿では,イベントタイプを制限せずにオープンイベント抽出をベンチマークする大規模文レベルのデータセットである title2event を提案する。
Title2Eventには42,000以上のニュースタイトルがあり、34のトピックが中国のWebページから集められている。
私たちの知る限りでは、オープンイベント抽出のための手作業による中国最大のデータセットです。
さらに,異なるモデルを用いたTitle2Eventの実験を行い,この課題に関する先進的な研究の重要性に対処しながら,タイトルの特徴がイベント抽出に困難であることを示す。
データセットとベースラインコードはhttps://open-event-hub.github.io/title2eventで入手できる。
関連論文リスト
- EXCEEDS: Extracting Complex Events as Connecting the Dots to Graphs in Scientific Domain [57.56639626657212]
我々は、科学領域に適したスキーマを備えた大規模マルチイベント文書レベルデータセットであるSciEventsを構築した。
そこで我々は,グリッドマトリックスに高密度ナゲットを格納することで,新しいエンドツーエンドの科学的イベント抽出フレームワークEXCEEDSを提案する。
実験により,SciEvents上でのEXCEEDSの最先端性能が実証された。
論文 参考訳(メタデータ) (2024-06-20T07:50:37Z) - Improving Event Definition Following For Zero-Shot Event Detection [66.27883872707523]
ゼロショットイベント検出に対する既存のアプローチは通常、既知のイベントタイプをアノテートしたデータセット上でモデルをトレーニングする。
イベント定義に従うためのトレーニングモデルによるゼロショットイベント検出の改善を目指しています。
論文 参考訳(メタデータ) (2024-03-05T01:46:50Z) - MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding Dataset with Event Argument Annotation [104.6065882758648]
MAVEN-Argは、イベント検出、イベント引数抽出、イベント関係抽出をサポートする最初のオールインワンデータセットである。
EAEベンチマークでは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)EAEのすべてのタスク変種をサポートする包括的なアノテーションの3つの利点がある。
論文 参考訳(メタデータ) (2023-11-15T16:52:14Z) - Rich Event Modeling for Script Event Prediction [60.67635412135682]
スクリプトイベント予測のためのリッチイベント予測(REP)フレームワークを提案する。
REPは、テキストからそのような情報を抽出するイベント抽出器を含む。
予測器の中核となるコンポーネントは、任意の数の引数を柔軟に扱う変換器ベースのイベントエンコーダである。
論文 参考訳(メタデータ) (2022-12-16T05:17:59Z) - MEE: A Novel Multilingual Event Extraction Dataset [62.80569691825534]
Event extractは、イベント参照とその引数をテキストから認識することを目的としている。
モデルトレーニングと評価のための高品質な多言語EEデータセットの欠如が主な障害となっている。
本稿では,8言語で50万以上のイベントを参照するアノテーションを提供する新しい多言語イベント抽出データセット(EE)を提案する。
論文 参考訳(メタデータ) (2022-11-11T02:01:41Z) - EventGraph: Event Extraction as Semantic Graph Parsing [5.21480688623047]
イベント抽出には、イベントトリガとそれに対応するイベント引数の両方の検出と抽出が含まれる。
イベントをグラフとしてエンコードするイベント抽出のための共同フレームワークであるEventGraphを提案する。
私たちのコードとモデルはオープンソースとしてリリースされています。
論文 参考訳(メタデータ) (2022-10-16T22:11:46Z) - Beyond Grounding: Extracting Fine-Grained Event Hierarchies Across
Modalities [43.048896440009784]
マルチモーダル(ビデオとテキスト)データからイベント階層を抽出するタスクを提案する。
これはイベントの構造を明らかにし、それらを理解するのに不可欠である。
我々は,この課題に対して,最先端のユニモーダルベースラインとマルチモーダルベースラインの限界を示す。
論文 参考訳(メタデータ) (2022-06-14T23:24:15Z) - PILED: An Identify-and-Localize Framework for Few-Shot Event Detection [79.66042333016478]
本研究では,事前学習した言語モデルから事象関連知識を引き出すために,クローゼプロンプトを用いた。
型固有のパラメータの数を最小化し、新しい型に対するイベント検出タスクに迅速に適応できるようにします。
論文 参考訳(メタデータ) (2022-02-15T18:01:39Z) - Document-level Event Extraction with Efficient End-to-end Learning of
Cross-event Dependencies [37.96254956540803]
本稿では,構造化予測アルゴリズムであるDeep Value Networks (DVN) を利用したエンドツーエンドモデルを提案する。
提案手法はACE05上でのCRFモデルに匹敵する性能を達成し,計算効率は極めて高い。
論文 参考訳(メタデータ) (2020-10-24T05:28:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。