論文の概要: Detection of COVID-19 informative tweets using RoBERTa
- arxiv url: http://arxiv.org/abs/2010.11238v1
- Date: Wed, 21 Oct 2020 18:43:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 00:36:12.415616
- Title: Detection of COVID-19 informative tweets using RoBERTa
- Title(参考訳): RoBERTaを用いた新型コロナウイルス情報ツイートの検出
- Authors: Sirigireddy Dhanalaxmi, Rohit Agarwal, Aman Sinha
- Abstract要約: 我々は,2020年のW-NUTワークショップの一環として,RoBERTaモデルを用いて,情報発信型Covid-19英語のつぶやきを検出する作業について紹介する。
F1スコアが0.89、リーダーボードが0.87である公開データセット上で、我々のモデルの有効性を示す。
- 参考スコア(独自算出の注目度): 5.564705758320338
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Social media such as Twitter is a hotspot of user-generated information. In
this ongoing Covid-19 pandemic, there has been an abundance of data on social
media which can be classified as informative and uninformative content. In this
paper, we present our work to detect informative Covid-19 English tweets using
RoBERTa model as a part of the W-NUT workshop 2020. We show the efficacy of our
model on a public dataset with an F1-score of 0.89 on the validation dataset
and 0.87 on the leaderboard.
- Abstract(参考訳): Twitterのようなソーシャルメディアは、ユーザー生成情報のホットスポットである。
進行中のCovid-19パンデミックでは、ソーシャルメディア上の大量のデータが、情報的かつ非情報的コンテンツとして分類されている。
本稿では,2020年のW-NUTワークショップの一環として,RoBERTaモデルを用いて,情報発信型Covid-19英語ツイートを検出する。
検証データセットではf1-scoreが0.89、リーダボードでは 0.87 のパブリックデータセット上でのモデルの有効性を示す。
関連論文リスト
- ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - BotArtist: Generic approach for bot detection in Twitter via semi-automatic machine learning pipeline [47.61306219245444]
Twitterは、ボットや偽アカウントのターゲットとなり、偽情報や操作の拡散につながった。
本稿では,機械学習モデル開発に関連する課題に対処するために,セミオートマチック機械学習パイプライン(SAMLP)を提案する。
ユーザプロファイル機能に基づいたボット検出モデルBotArtistを開発した。
論文 参考訳(メタデータ) (2023-05-31T09:12:35Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - CML-COVID: A Large-Scale COVID-19 Twitter Dataset with Latent Topics,
Sentiment and Location Information [0.0]
CML-COVID(CML-COVID)は、新型コロナウイルス(COVID-19)による5,977,653人のツイート19,298,967万件のTwitterデータセットである。
これらのツイートは、2020年3月から7月にかけて、新型コロナウイルスに関連する質問文、コビッド、マスクを使って収集された。
論文 参考訳(メタデータ) (2021-01-28T18:59:10Z) - Model Generalization on COVID-19 Fake News Detection [41.03093888315081]
CONSTRAINT 2021(FakeNews-19)で提案された偽ニュース検出タスクの堅牢なモデルの実現を目指す。
新型コロナの偽ニュースの2つのテストセットでモデルを評価します。
論文 参考訳(メタデータ) (2021-01-11T12:23:41Z) - A Heuristic-driven Ensemble Framework for COVID-19 Fake News Detection [5.979726271522835]
新型コロナウイルスに関連するツイートが「本物」か「フェイク」かを自動で識別するフェイクニュース検知システムについて述べる。
リーダーボードのジョイント8位を達成するためのトレーニング済みモデルで構成されたアンサンブルモデルを使用しています。
F1スコア0.9883のツイートにユーザ名ハンドルとリンクドメインに基づく新しいアルゴリズムを組み込むことで,システムを大幅に改善することができた。
論文 参考訳(メタデータ) (2021-01-10T13:21:08Z) - Fighting an Infodemic: COVID-19 Fake News Dataset [40.418407303807456]
偽ニュースや噂はソーシャルメディアで広まっている。
これを解決するために、新型コロナウイルス(COVID-19)のソーシャルメディア投稿10,700件の注釈付きデータセットとリアルニュースとフェイクニュースの記事を手動でキュレートし、リリースしました。
論文 参考訳(メタデータ) (2020-11-06T13:09:37Z) - NutCracker at WNUT-2020 Task 2: Robustly Identifying Informative
COVID-19 Tweets using Ensembling and Adversarial Training [6.85316573653194]
我々は、新型コロナウイルスのツイートを識別するために、COVID-Twitter-BERTとRoBERTaモデルを実験した。
COVID-Twitter-BERTとRoBERTaのアンサンブルは、WNUT-2020 Task 2のテストデータから0.9096のF1スコアを取得し、リーダーボードで1位となった。
論文 参考訳(メタデータ) (2020-10-09T02:46:51Z) - UIT-HSE at WNUT-2020 Task 2: Exploiting CT-BERT for Identifying COVID-19
Information on the Twitter Social Network [2.7528170226206443]
本稿では,W-NUT 2020 Shared Task 2: Identification of Informative COVID-19 English Tweets。
我々は,様々な微調整技術を用いた COVID-Twitter-BERT (CT-BERT) に基づくトランスフォーマーモデルを用いた簡易かつ効果的なアプローチを提案する。
その結果、F1スコアの90.94%を達成し、このタスクのリーダーボードで3位となり、合計56チームが参加した。
論文 参考訳(メタデータ) (2020-09-07T08:20:31Z) - COVID-19 on Social Media: Analyzing Misinformation in Twitter
Conversations [22.43295864610142]
私たちは、2020年3月1日からTwitter APIを使用して、COVID-19に関連するストリーミングデータを収集しました。
事実確認情報をもとに、信頼できない内容と誤解を招く内容を特定した。
偽情報ツイートで宣伝された物語と、これらのツイートとのエンゲージメントの分配について検討した。
論文 参考訳(メタデータ) (2020-03-26T09:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。