論文の概要: Event Detection Explorer: An Interactive Tool for Event Detection
Exploration
- arxiv url: http://arxiv.org/abs/2204.12456v1
- Date: Tue, 26 Apr 2022 17:22:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 12:40:59.621307
- Title: Event Detection Explorer: An Interactive Tool for Event Detection
Exploration
- Title(参考訳): Event Detection Explorer: イベント検出探索のためのインタラクティブツール
- Authors: Wenlong Zhang, Bhagyashree Ingale, Hamza Shabir, Tianyi Li, Tian Shi,
Ping Wang
- Abstract要約: イベント検出(ED)は自然言語処理において重要なタスクである。
本稿では,EDデータセットとモデル探索のためのインタラクティブで使いやすいツールであるEDエクスプローラーを提案する。
- 参考スコア(独自算出の注目度): 15.673794190575295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Event Detection (ED) is an important task in natural language processing. In
the past few years, many datasets have been introduced for advancing ED machine
learning models. However, most of these datasets are under-explored because not
many tools are available for people to study events, trigger words, and event
mention instances systematically and efficiently. In this paper, we present an
interactive and easy-to-use tool, namely ED Explorer, for ED dataset and model
exploration. ED Explorer consists of an interactive web application, an API,
and an NLP toolkit, which can help both domain experts and non-experts to
better understand the ED task. We use ED Explorer to analyze a recent proposed
large-scale ED datasets (referred to as MAVEN), and discover several underlying
problems, including sparsity, label bias, label imbalance, and debatable
annotations, which provide us with directions to improve the MAVEN dataset. The
ED Explorer can be publicly accessed through http://edx.leafnlp.org/. The
demonstration video is available here
https://www.youtube.com/watch?v=6QPnxPwxg50.
- Abstract(参考訳): イベント検出(ED)は自然言語処理において重要なタスクである。
過去数年間、ed機械学習モデルの進歩のために多くのデータセットが導入された。
しかし、これらのデータセットの多くは、人々がイベント、トリガーワード、イベント参照インスタンスを体系的かつ効率的に研究できるツールがあまり多くないため、未調査である。
本稿では,EDデータセットとモデル探索のためのインタラクティブで使いやすいツールであるED Explorerを提案する。
ED Explorerは対話型Webアプリケーション、API、NLPツールキットで構成されており、ドメインの専門家と非専門家の両方がEDタスクをよりよく理解するのに役立ちます。
EDエクスプローラーを使用して、最近提案された大規模EDデータセット(MAVENと呼ばれる)を分析し、スパーシリティ、ラベルバイアス、ラベルの不均衡、デバタブルアノテーションなど、いくつかの根本的な問題を発見し、MAVENデータセットを改善するためのガイダンスを提供する。
ED Explorer は http://edx.leafnlp.org/ を通じて公開することができる。
デモビデオはhttps://www.youtube.com/watch?
v=6QPnxPwxg50。
関連論文リスト
- Large Language Models for Generative Information Extraction: A Survey [93.28676955662002]
情報抽出は、平易な自然言語テキストから構造的知識を抽出することを目的としている。
生成型大規模言語モデル(LLM)は、テキストの理解と生成において顕著な能力を示した。
LLMは生成パラダイムに基づいたIEタスクに対して実行可能なソリューションを提供する。
論文 参考訳(メタデータ) (2023-12-29T14:25:22Z) - Learn to Explore: on Bootstrapping Interactive Data Exploration with
Meta-learning [8.92180350317399]
本稿ではメタ学習に基づく学習から発見までのフレームワークを提案し,メタタスクを自動生成した分類器の学習方法を学習する。
提案手法は,精度と効率の点で既存探索法よりも優れている。
論文 参考訳(メタデータ) (2022-12-07T03:12:41Z) - MINION: a Large-Scale and Diverse Dataset for Multilingual Event
Detection [65.46122357928041]
Event Detection (ED) は、テキスト中のイベント参照のトリガーワードを識別し、分類するタスクである。
主な疑問は、既存のEDモデルが異なる言語でどれだけうまく機能するか、EDが他の言語でどの程度困難であるか、EDの知識とアノテーションが言語間でどの程度うまく伝達できるかである。
EDのための大規模多言語データセット(MINION)を導入し、8つの異なる言語でのイベントを一貫してアノテートする。
論文 参考訳(メタデータ) (2022-11-11T02:09:51Z) - MEE: A Novel Multilingual Event Extraction Dataset [62.80569691825534]
Event extractは、イベント参照とその引数をテキストから認識することを目的としている。
モデルトレーニングと評価のための高品質な多言語EEデータセットの欠如が主な障害となっている。
本稿では,8言語で50万以上のイベントを参照するアノテーションを提供する新しい多言語イベント抽出データセット(EE)を提案する。
論文 参考訳(メタデータ) (2022-11-11T02:01:41Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - SciREX: A Challenge Dataset for Document-Level Information Extraction [56.83748634747753]
ドキュメントレベルで大規模な情報抽出データセットを作成するのは難しい。
複数のIEタスクを含む文書レベルのIEデータセットであるSciREXを紹介する。
我々は、従来の最先端のIEモデルをドキュメントレベルのIEに拡張する強力なベースラインとして、ニューラルモデルを開発する。
論文 参考訳(メタデータ) (2020-05-01T17:30:10Z) - MAVEN: A Massive General Domain Event Detection Dataset [56.00401399384715]
イベント検出(ED)は、プレーンテキストからイベント知識を抽出する最初の、最も基本的なステップである。
既存のデータセットは、EDのさらなる開発を制限する問題を示す。
我々は,4,480のウィキペディア文書,118,732のイベント参照インスタンス,168のイベントタイプを含むMAVEN(Massive eVENt detection dataset)を提案する。
論文 参考訳(メタデータ) (2020-04-28T15:25:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。