論文の概要: UIT-HSE at WNUT-2020 Task 2: Exploiting CT-BERT for Identifying COVID-19
Information on the Twitter Social Network
- arxiv url: http://arxiv.org/abs/2009.02935v3
- Date: Fri, 13 Nov 2020 08:48:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 02:56:52.053080
- Title: UIT-HSE at WNUT-2020 Task 2: Exploiting CT-BERT for Identifying COVID-19
Information on the Twitter Social Network
- Title(参考訳): UIT-HSE at WNUT-2020 Task 2: Exploiting CT-BERT for Identification COVID-19 Information on the Twitter Social Network
- Authors: Khiem Vinh Tran, Hao Phu Phan, Kiet Van Nguyen, Ngan Luu-Thuy Nguyen
- Abstract要約: 本稿では,W-NUT 2020 Shared Task 2: Identification of Informative COVID-19 English Tweets。
我々は,様々な微調整技術を用いた COVID-Twitter-BERT (CT-BERT) に基づくトランスフォーマーモデルを用いた簡易かつ効果的なアプローチを提案する。
その結果、F1スコアの90.94%を達成し、このタスクのリーダーボードで3位となり、合計56チームが参加した。
- 参考スコア(独自算出の注目度): 2.7528170226206443
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recently, COVID-19 has affected a variety of real-life aspects of the world
and led to dreadful consequences. More and more tweets about COVID-19 has been
shared publicly on Twitter. However, the plurality of those Tweets are
uninformative, which is challenging to build automatic systems to detect the
informative ones for useful AI applications. In this paper, we present our
results at the W-NUT 2020 Shared Task 2: Identification of Informative COVID-19
English Tweets. In particular, we propose our simple but effective approach
using the transformer-based models based on COVID-Twitter-BERT (CT-BERT) with
different fine-tuning techniques. As a result, we achieve the F1-Score of
90.94\% with the third place on the leaderboard of this task which attracted 56
submitted teams in total.
- Abstract(参考訳): 最近、新型コロナウイルスは世界中の様々な現実の側面に影響を与え、恐ろしい結果をもたらした。
新型コロナウイルスに関するツイートがTwitterで公開されている。
しかし、これら複数のつぶやきは非形式的であり、有用なAIアプリケーションのための情報的ツイートを検出する自動システムを構築することは困難である。
本稿では,w-nut 2020 share task 2: identification of informative covid-19 english tweets で行った。
特に,様々な微調整技術を用いて,COVID-Twitter-BERT(CT-BERT)に基づくトランスフォーマーモデルを用いた簡易かつ効果的なアプローチを提案する。
その結果、F1スコア90.94\%を達成し、このタスクのリーダーボードで3位となり、合計56チームが参加した。
関連論文リスト
- ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - UniCon+: ICTCAS-UCAS Submission to the AVA-ActiveSpeaker Task at
ActivityNet Challenge 2022 [69.67841335302576]
本稿では,アクティベーションネットチャレンジ2022におけるAVAアクティブ話者検出(ASD)課題に対する,我々の勝利ソリューションの簡潔な説明を行う。
基盤となるモデルであるUniCon+は、以前の作業であるUnified Context Network(UniCon)とExtended UniConの上に構築され続けています。
アーキテクチャをシンプルなGRUベースのモジュールで拡張し、繰り返し発生するアイデンティティの情報がシーンを流れるようにします。
論文 参考訳(メタデータ) (2022-06-22T06:11:07Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Detection of COVID-19 informative tweets using RoBERTa [5.564705758320338]
我々は,2020年のW-NUTワークショップの一環として,RoBERTaモデルを用いて,情報発信型Covid-19英語のつぶやきを検出する作業について紹介する。
F1スコアが0.89、リーダーボードが0.87である公開データセット上で、我々のモデルの有効性を示す。
論文 参考訳(メタデータ) (2020-10-21T18:43:13Z) - NutCracker at WNUT-2020 Task 2: Robustly Identifying Informative
COVID-19 Tweets using Ensembling and Adversarial Training [6.85316573653194]
我々は、新型コロナウイルスのツイートを識別するために、COVID-Twitter-BERTとRoBERTaモデルを実験した。
COVID-Twitter-BERTとRoBERTaのアンサンブルは、WNUT-2020 Task 2のテストデータから0.9096のF1スコアを取得し、リーダーボードで1位となった。
論文 参考訳(メタデータ) (2020-10-09T02:46:51Z) - Not-NUTs at W-NUT 2020 Task 2: A BERT-based System in Identifying
Informative COVID-19 English Tweets [0.0]
本稿では、英語のつぶやきを前提として、そのツイートがCOVID-19に関する情報的内容を持つかどうかを自動的に識別するモデルを提案する。
インフォメーションクラスにおけるF1スコアの約1%は、トップパフォーマンスチームによる結果にしか影響しない競争的な結果を達成しました。
論文 参考訳(メタデータ) (2020-09-14T15:49:16Z) - EdinburghNLP at WNUT-2020 Task 2: Leveraging Transformers with
Generalized Augmentation for Identifying Informativeness in COVID-19 Tweets [0.0]
WNUT Task 2: informationative COVID-19 English Tweets の同定を行う。
私たちの最も成功したモデルは、RoBERTa、XLNet、BERTweetといったトランスフォーマーのアンサンブルで、Semi-Supervised Learning (SSL)環境でトレーニングされています。
提案システムでは,テストセット上でのF1スコアが0.9011(リーダボードでは7位)に達し,FastText埋め込みを用いたシステムに比べて性能が大幅に向上した。
論文 参考訳(メタデータ) (2020-09-06T15:57:28Z) - TATL at W-NUT 2020 Task 2: A Transformer-based Baseline System for
Identification of Informative COVID-19 English Tweets [1.4315501760755605]
W-NUT 2020 Shared Task 2: Identification of Informative COVID-19 English Tweets。
事前訓練されたトランスフォーマー言語モデルの最近の進歩に触発されて,タスクの単純かつ効果的なベースラインを提案する。
その単純さにもかかわらず、私たちの提案したアプローチは、リーダーボードに非常に競争力のある結果を示します。
論文 参考訳(メタデータ) (2020-08-28T21:27:42Z) - Privacy-Aware Recommender Systems Challenge on Twitter's Home Timeline [47.434392695347924]
ACM RecSysが主催するRecSys 2020 Challengeは、このデータセットを使用してTwitterと提携している。
本稿では,ユーザエンゲージメントを予測しようとする研究者や専門家が直面する課題について述べる。
論文 参考訳(メタデータ) (2020-04-28T23:54:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。