論文の概要: EdinburghNLP at WNUT-2020 Task 2: Leveraging Transformers with
Generalized Augmentation for Identifying Informativeness in COVID-19 Tweets
- arxiv url: http://arxiv.org/abs/2009.06375v3
- Date: Sun, 18 Apr 2021 12:28:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 07:53:56.053250
- Title: EdinburghNLP at WNUT-2020 Task 2: Leveraging Transformers with
Generalized Augmentation for Identifying Informativeness in COVID-19 Tweets
- Title(参考訳): EdinburghNLP at WNUT-2020 Task 2: Leveraging Transformer with Generalized Augmentation for Identifying Informativeness in COVID-19 Tweets
- Authors: Nickil Maveli
- Abstract要約: WNUT Task 2: informationative COVID-19 English Tweets の同定を行う。
私たちの最も成功したモデルは、RoBERTa、XLNet、BERTweetといったトランスフォーマーのアンサンブルで、Semi-Supervised Learning (SSL)環境でトレーニングされています。
提案システムでは,テストセット上でのF1スコアが0.9011(リーダボードでは7位)に達し,FastText埋め込みを用いたシステムに比べて性能が大幅に向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Twitter and, in general, social media has become an indispensable
communication channel in times of emergency. The ubiquitousness of smartphone
gadgets enables people to declare an emergency observed in real-time. As a
result, more agencies are interested in programmatically monitoring Twitter
(disaster relief organizations and news agencies). Therefore, recognizing the
informativeness of a Tweet can help filter noise from the large volumes of
Tweets. In this paper, we present our submission for WNUT-2020 Task 2:
Identification of informative COVID-19 English Tweets. Our most successful
model is an ensemble of transformers, including RoBERTa, XLNet, and BERTweet
trained in a Semi-Supervised Learning (SSL) setting. The proposed system
achieves an F1 score of 0.9011 on the test set (ranking 7th on the leaderboard)
and shows significant gains in performance compared to a baseline system using
FastText embeddings.
- Abstract(参考訳): Twitterと一般的には、ソーシャルメディアは緊急時に欠かせないコミュニケーションチャンネルになっている。
スマートフォンガジェットのユビキタス性により、ユーザーはリアルタイムで緊急事態を宣言できる。
その結果、多くの機関がTwitter(災害救助組織や報道機関)をプログラム的に監視することに興味を持っている。
したがって、ツイートの知性を認識することは、大量のツイートからノイズをフィルタリングするのに役立つ。
本稿では,wnut-2020 task 2: identification of informative covid-19 english tweetsについて述べる。
私たちの最も成功したモデルは、半教師付き学習(ssl)環境でトレーニングされたroberta、xlnet、bertweetを含むトランスフォーマーのアンサンブルです。
提案システムでは,テストセット上でのF1スコアが0.9011(リーダボードでは7位)に達し,FastText埋め込みを用いたベースラインシステムと比較して性能が大幅に向上した。
関連論文リスト
- ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - InfoMiner at WNUT-2020 Task 2: Transformer-based Covid-19 Informative
Tweet Extraction [9.710464466895521]
WNUT-2020 Task 2は、ノイズツイートからの情報的ツイートを認識するために編成された。
本稿では,変圧器を用いたタスク目的への取り組みについて述べる。
論文 参考訳(メタデータ) (2020-10-11T19:31:18Z) - NEU at WNUT-2020 Task 2: Data Augmentation To Tell BERT That Death Is
Not Necessarily Informative [0.0]
W-NUT2020 Shared Task 2: Identification of Informative COVID-19 English Tweets。
BERTは、情報的ツイートを識別するための簡単な信号を利用し、非情報的ツイートに単純なパターンを追加することで、BERTのパフォーマンスを劇的に低下させることを示す。
論文 参考訳(メタデータ) (2020-09-18T02:16:49Z) - Not-NUTs at W-NUT 2020 Task 2: A BERT-based System in Identifying
Informative COVID-19 English Tweets [0.0]
本稿では、英語のつぶやきを前提として、そのツイートがCOVID-19に関する情報的内容を持つかどうかを自動的に識別するモデルを提案する。
インフォメーションクラスにおけるF1スコアの約1%は、トップパフォーマンスチームによる結果にしか影響しない競争的な結果を達成しました。
論文 参考訳(メタデータ) (2020-09-14T15:49:16Z) - UIT-HSE at WNUT-2020 Task 2: Exploiting CT-BERT for Identifying COVID-19
Information on the Twitter Social Network [2.7528170226206443]
本稿では,W-NUT 2020 Shared Task 2: Identification of Informative COVID-19 English Tweets。
我々は,様々な微調整技術を用いた COVID-Twitter-BERT (CT-BERT) に基づくトランスフォーマーモデルを用いた簡易かつ効果的なアプローチを提案する。
その結果、F1スコアの90.94%を達成し、このタスクのリーダーボードで3位となり、合計56チームが参加した。
論文 参考訳(メタデータ) (2020-09-07T08:20:31Z) - TATL at W-NUT 2020 Task 2: A Transformer-based Baseline System for
Identification of Informative COVID-19 English Tweets [1.4315501760755605]
W-NUT 2020 Shared Task 2: Identification of Informative COVID-19 English Tweets。
事前訓練されたトランスフォーマー言語モデルの最近の進歩に触発されて,タスクの単純かつ効果的なベースラインを提案する。
その単純さにもかかわらず、私たちの提案したアプローチは、リーダーボードに非常に競争力のある結果を示します。
論文 参考訳(メタデータ) (2020-08-28T21:27:42Z) - Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for
Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。
我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文 参考訳(メタデータ) (2020-04-28T11:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。