論文の概要: UCD-CS at W-NUT 2020 Shared Task-3: A Text to Text Approach for COVID-19
Event Extraction on Social Media
- arxiv url: http://arxiv.org/abs/2009.10047v2
- Date: Mon, 12 Oct 2020 16:18:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 04:49:48.766290
- Title: UCD-CS at W-NUT 2020 Shared Task-3: A Text to Text Approach for COVID-19
Event Extraction on Social Media
- Title(参考訳): W-NUT 2020 Shared Task-3: A Text to Text Approach for COVID-19 Event extract on Social Media
- Authors: Congcong Wang and David Lillis
- Abstract要約: 当社のアプローチを共有タスクで説明する。TwitterからCOVID-19イベントを抽出する。
このタスクの目的は、新型コロナウイルスに関連するツイートから、事前に定義されたスロット満載の質問に回答を抽出することである。
本稿では,T5テキスト・テキスト・モデルを用いて,イベント抽出タスクを質問応答タスクとして扱う。
- 参考スコア(独自算出の注目度): 3.5585697639325113
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we describe our approach in the shared task: COVID-19 event
extraction from Twitter. The objective of this task is to extract answers from
COVID-related tweets to a set of predefined slot-filling questions. Our
approach treats the event extraction task as a question answering task by
leveraging the transformer-based T5 text-to-text model.
According to the official evaluation scores returned, namely F1, our
submitted run achieves competitive performance compared to other participating
runs (Top 3). However, we argue that this evaluation may underestimate the
actual performance of runs based on text-generation. Although some such runs
may answer the slot questions well, they may not be an exact string match for
the gold standard answers. To measure the extent of this underestimation, we
adopt a simple exact-answer transformation method aiming at converting the
well-answered predictions to exactly-matched predictions. The results show that
after this transformation our run overall reaches the same level of performance
as the best participating run and state-of-the-art F1 scores in three of five
COVID-related events. Our code is publicly available to aid reproducibility
- Abstract(参考訳): 本稿では,TwitterからのCOVID-19イベント抽出という,共有タスクにおけるアプローチについて述べる。
このタスクの目的は、covid-19関連のツイートから、事前に定義されたスロット満載の質問に答えを抽出することである。
本稿では,t5テキストからテキストへの変換モデルを用いて,イベント抽出タスクを質問応答タスクとして扱う。
得られた公式評価スコア,すなわちF1では,我々の提出したランは,他の参加ランと比較して競争性能が向上する(第3位)。
しかし,本評価はテキスト生成に基づく実行性能を過小評価する可能性がある。
そのような実行はスロットの質問によく答えるかもしれないが、ゴールドの標準の回答と正確な文字列マッチではないかもしれない。
この過小評価の程度を測るために、よく解答された予測を正確に整合した予測に変換することを目的とした、単純な正解変換法を採用する。
その結果,5つのCOVID関連イベントのうち3つにおいて,私たちのラン全体のパフォーマンスは,最高の参加ランと最先端のF1スコアと同等であることが判明した。
私たちのコードは再現性を支援するために公開されています
関連論文リスト
- An Energy-based Model for Word-level AutoCompletion in Computer-aided Translation [97.3797716862478]
Word-level AutoCompletion (WLAC) は、コンピュータ支援翻訳における報奨だが挑戦的なタスクである。
既存の作業は、入力コンテキストの隠れベクターを対応するラベルにマッピングするニューラルネットワークに基づく分類モデルを通じて、このタスクに対処する。
そこで本研究では,WLACのエネルギーモデルを提案する。
論文 参考訳(メタデータ) (2024-07-29T15:07:19Z) - Towards Event Extraction from Speech with Contextual Clues [61.164413398231254]
本稿では,音声イベント抽出(SpeechEE)タスクを導入し,3つの合成トレーニングセットと1つの人為的テストセットを構築した。
テキストからのイベント抽出と比較して、SpeechEEは、主に連続的で単語境界を持たない複雑な音声信号のために、より大きな課題を提起する。
我々の手法はすべてのデータセットに大幅な改善をもたらし、最大10.7%のF1ゲインを達成する。
論文 参考訳(メタデータ) (2024-01-27T11:07:19Z) - Link Prediction for Wikipedia Articles as a Natural Language Inference
Task [1.1842520528140819]
本稿では、自然言語推論(NLI)タスクとして定式化することで、ウィキペディアの記事の予測をリンクする手法を提案する。
ウィキペディア記事タスクのリンク予測のための文ペア分類に基づくシステムを実装した。
当システムでは,公開テストセットとプライベートテストセットでそれぞれ0.99996 Macro F1スコアと1.00000 Macro F1スコアを達成した。
論文 参考訳(メタデータ) (2023-08-31T05:25:04Z) - ICDAR 2023 Competition on Structured Text Extraction from Visually-Rich
Document Images [198.35937007558078]
大会は2022年12月30日に開かれ、2023年3月24日に閉幕した。
トラック1には35人の参加者と91人の有効な応募があり、トラック2には15人の参加者と26人の応募がある。
提案手法の性能によると, 複雑なシナリオやゼロショットシナリオにおいて, 期待される情報抽出性能にはまだ大きなギャップがあると考えられる。
論文 参考訳(メタデータ) (2023-06-05T22:20:52Z) - MIA 2022 Shared Task Submission: Leveraging Entity Representations,
Dense-Sparse Hybrids, and Fusion-in-Decoder for Cross-Lingual Question
Answering [5.837881923712393]
複数言語情報アクセス(MIA)2022のための2段階システムについて述べる。
第1段階は多言語通訳検索とハイブリッド密集型スパース検索戦略からなる。
第2段は、第1段によって返される上位通路から回答を出力する読者で構成される。
論文 参考訳(メタデータ) (2022-07-05T10:27:17Z) - UniTE: Unified Translation Evaluation [63.58868113074476]
UniTEは3つの評価タスクをすべて処理する能力に携わる最初の統合フレームワークである。
We testify our framework on WMT 2019 Metrics and WMT 2020 Quality Estimation benchmarks。
論文 参考訳(メタデータ) (2022-04-28T08:35:26Z) - Zero-Shot Information Extraction as a Unified Text-to-Triple Translation [56.01830747416606]
我々は、テキストから3つの翻訳フレームワークに一連の情報抽出タスクを投入した。
タスク固有の入力テキストと出力トリプルの変換としてタスクを形式化する。
本稿では,オープン情報抽出におけるゼロショット性能について検討する。
論文 参考訳(メタデータ) (2021-09-23T06:54:19Z) - Exploiting Unsupervised Data for Emotion Recognition in Conversations [76.01690906995286]
会話における感情認識(Emotion Recognition in Conversations:ERC)は、会話における話者の感情状態を予測することを目的としている。
ERCタスクの教師付きデータは限られている。
教師なし会話データを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-02T13:28:47Z) - Phonemer at WNUT-2020 Task 2: Sequence Classification Using COVID
Twitter BERT and Bagging Ensemble Technique based on Plurality Voting [0.0]
新型コロナウイルス(COVID-19)に関連する英語のつぶやきを自動的に識別するシステムを開発した。
最終アプローチでは0.9037のF1スコアを達成し,F1スコアを評価基準として総合6位にランク付けした。
論文 参考訳(メタデータ) (2020-10-01T10:54:54Z) - TEST_POSITIVE at W-NUT 2020 Shared Task-3: Joint Event Multi-task
Learning for Slot Filling in Noisy Text [26.270447944466557]
本稿では,Twitter から COVID-19 イベントを抽出する統合イベントマルチタスク学習 (JOELIN) モデルを提案する。
統一されたグローバルラーニングフレームワークを通じて、異なるイベントにわたるトレーニングデータを全て利用して、言語モデルを学習し、微調整する。
我々は,その予測をさらにフィルタリングするために,名前付きエンティティ認識(NER)を用いた型認識後処理手法を実装した。
論文 参考訳(メタデータ) (2020-09-29T19:08:45Z) - BUT-FIT at SemEval-2020 Task 5: Automatic detection of counterfactual
statements with deep pre-trained language representation models [6.853018135783218]
本稿では,BUT-FITによるSemEval-2020 Task 5: Modelling Causal Reasoning in Language: Detecting Counterfactualsについて述べる。
課題は、ある文が偽物を含むかどうかを検出することである。
どちらのサブタスクでも,RoBERTa LRMが最善を尽くすことがわかった。
論文 参考訳(メタデータ) (2020-07-28T11:16:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。