論文の概要: Event Detection Explorer: An Interactive Tool for Event Detection
Exploration
- arxiv url: http://arxiv.org/abs/2204.12456v1
- Date: Tue, 26 Apr 2022 17:22:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 12:40:59.621307
- Title: Event Detection Explorer: An Interactive Tool for Event Detection
Exploration
- Title(参考訳): Event Detection Explorer: イベント検出探索のためのインタラクティブツール
- Authors: Wenlong Zhang, Bhagyashree Ingale, Hamza Shabir, Tianyi Li, Tian Shi,
Ping Wang
- Abstract要約: イベント検出(ED)は自然言語処理において重要なタスクである。
本稿では,EDデータセットとモデル探索のためのインタラクティブで使いやすいツールであるEDエクスプローラーを提案する。
- 参考スコア(独自算出の注目度): 15.673794190575295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Event Detection (ED) is an important task in natural language processing. In
the past few years, many datasets have been introduced for advancing ED machine
learning models. However, most of these datasets are under-explored because not
many tools are available for people to study events, trigger words, and event
mention instances systematically and efficiently. In this paper, we present an
interactive and easy-to-use tool, namely ED Explorer, for ED dataset and model
exploration. ED Explorer consists of an interactive web application, an API,
and an NLP toolkit, which can help both domain experts and non-experts to
better understand the ED task. We use ED Explorer to analyze a recent proposed
large-scale ED datasets (referred to as MAVEN), and discover several underlying
problems, including sparsity, label bias, label imbalance, and debatable
annotations, which provide us with directions to improve the MAVEN dataset. The
ED Explorer can be publicly accessed through http://edx.leafnlp.org/. The
demonstration video is available here
https://www.youtube.com/watch?v=6QPnxPwxg50.
- Abstract(参考訳): イベント検出(ED)は自然言語処理において重要なタスクである。
過去数年間、ed機械学習モデルの進歩のために多くのデータセットが導入された。
しかし、これらのデータセットの多くは、人々がイベント、トリガーワード、イベント参照インスタンスを体系的かつ効率的に研究できるツールがあまり多くないため、未調査である。
本稿では,EDデータセットとモデル探索のためのインタラクティブで使いやすいツールであるED Explorerを提案する。
ED Explorerは対話型Webアプリケーション、API、NLPツールキットで構成されており、ドメインの専門家と非専門家の両方がEDタスクをよりよく理解するのに役立ちます。
EDエクスプローラーを使用して、最近提案された大規模EDデータセット(MAVENと呼ばれる)を分析し、スパーシリティ、ラベルバイアス、ラベルの不均衡、デバタブルアノテーションなど、いくつかの根本的な問題を発見し、MAVENデータセットを改善するためのガイダンスを提供する。
ED Explorer は http://edx.leafnlp.org/ を通じて公開することができる。
デモビデオはhttps://www.youtube.com/watch?
v=6QPnxPwxg50。
関連論文リスト
- MultiADE: A Multi-domain Benchmark for Adverse Drug Event Extraction [11.458594744457521]
アクティブな有害事象監視は、異なるデータソースからの逆薬物イベント(ADE)を監視する。
ほとんどのデータセットや共有タスクは、特定のタイプのテキストからADEを抽出することに焦点を当てている。
ドメインの一般化 - 新しい、目に見えないドメイン(テキストタイプ)でうまく機能する機械学習モデルの能力は、まだ解明されていない。
我々はMultiADEと名づけた有害薬物イベント抽出のためのベンチマークを構築した。
論文 参考訳(メタデータ) (2024-05-28T09:57:28Z) - ADELIE: Aligning Large Language Models on Information Extraction [55.60192044049083]
大規模言語モデル(LLM)は通常、情報抽出タスクで不足する。
本稿では,様々なIEタスクを効果的に解決する協調LLMであるADELIEを紹介する。
本稿では,オープンソースモデル間でのSoTA(State-of-the-art)性能について述べる。
論文 参考訳(メタデータ) (2024-05-08T12:24:52Z) - Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。
各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。
我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文 参考訳(メタデータ) (2023-12-29T14:25:22Z) - MINION: a Large-Scale and Diverse Dataset for Multilingual Event
Detection [65.46122357928041]
Event Detection (ED) は、テキスト中のイベント参照のトリガーワードを識別し、分類するタスクである。
主な疑問は、既存のEDモデルが異なる言語でどれだけうまく機能するか、EDが他の言語でどの程度困難であるか、EDの知識とアノテーションが言語間でどの程度うまく伝達できるかである。
EDのための大規模多言語データセット(MINION)を導入し、8つの異なる言語でのイベントを一貫してアノテートする。
論文 参考訳(メタデータ) (2022-11-11T02:09:51Z) - MEE: A Novel Multilingual Event Extraction Dataset [62.80569691825534]
Event extractは、イベント参照とその引数をテキストから認識することを目的としている。
モデルトレーニングと評価のための高品質な多言語EEデータセットの欠如が主な障害となっている。
本稿では,8言語で50万以上のイベントを参照するアノテーションを提供する新しい多言語イベント抽出データセット(EE)を提案する。
論文 参考訳(メタデータ) (2022-11-11T02:01:41Z) - SciREX: A Challenge Dataset for Document-Level Information Extraction [56.83748634747753]
ドキュメントレベルで大規模な情報抽出データセットを作成するのは難しい。
複数のIEタスクを含む文書レベルのIEデータセットであるSciREXを紹介する。
我々は、従来の最先端のIEモデルをドキュメントレベルのIEに拡張する強力なベースラインとして、ニューラルモデルを開発する。
論文 参考訳(メタデータ) (2020-05-01T17:30:10Z) - MAVEN: A Massive General Domain Event Detection Dataset [56.00401399384715]
イベント検出(ED)は、プレーンテキストからイベント知識を抽出する最初の、最も基本的なステップである。
既存のデータセットは、EDのさらなる開発を制限する問題を示す。
我々は,4,480のウィキペディア文書,118,732のイベント参照インスタンス,168のイベントタイプを含むMAVEN(Massive eVENt detection dataset)を提案する。
論文 参考訳(メタデータ) (2020-04-28T15:25:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。