論文の概要: Misleading the Covid-19 vaccination discourse on Twitter: An exploratory
study of infodemic around the pandemic
- arxiv url: http://arxiv.org/abs/2108.10735v1
- Date: Mon, 16 Aug 2021 17:02:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-29 12:11:56.922871
- Title: Misleading the Covid-19 vaccination discourse on Twitter: An exploratory
study of infodemic around the pandemic
- Title(参考訳): Covid-19ワクチン接種に関するTwitter上の誤解:パンデミックに関するインフォデミックの探索的研究
- Authors: Shakshi Sharma, Rajesh Sharma, and Anwitaman Datta
- Abstract要約: 我々は7ヶ月(2020年9月~2021年3月)のコビッドウイルスワクチン接種に関連する中規模のツイートコーパス(20万件)を収集する。
Transfer Learningのアプローチに従えば、事前訓練されたTransformerベースのXLNetモデルを使用して、ツイートをミスリーディングまたは非ミスリーディングに分類する。
我々は、自然に誤解を招くコーパスのツイートの特徴と非誤解を招くツイートの特徴を調査・対比するためにこの手法を構築した。
いくつかのMLモデルは、最大90%の精度で予測に使用され、各特徴の重要性は、SHAP Explainable AI (X)を用いて説明される。
- 参考スコア(独自算出の注目度): 0.45593531937154413
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we collect a moderate-sized representative corpus of tweets
(200,000 approx.) pertaining Covid-19 vaccination spanning over a period of
seven months (September 2020 - March 2021). Following a Transfer Learning
approach, we utilize the pre-trained Transformer-based XLNet model to classify
tweets as Misleading or Non-Misleading and validate against a random subset of
results manually. We build on this to study and contrast the characteristics of
tweets in the corpus that are misleading in nature against non-misleading ones.
This exploratory analysis enables us to design features (such as sentiments,
hashtags, nouns, pronouns, etc) that can, in turn, be exploited for classifying
tweets as (Non-)Misleading using various ML models in an explainable manner.
Specifically, several ML models are employed for prediction, with up to 90%
accuracy, and the importance of each feature is explained using SHAP
Explainable AI (XAI) tool. While the thrust of this work is principally
exploratory analysis in order to obtain insights on the online discourse on
Covid-19 vaccination, we conclude the paper by outlining how these insights
provide the foundations for a more actionable approach to mitigate
misinformation. The curated dataset and code is made available (Github
repository) so that the research community at large can reproduce, compare
against, or build upon this work.
- Abstract(参考訳): 本研究では,中規模のツイートコーパス(約20万)を収集した。
新型コロナウイルスの予防接種は7ヶ月(2020年9月~2021年3月)にまたがる。
トランスファー学習のアプローチに従って,事前学習されたトランスフォーマーベースのxlnetモデルを用いて,ツイートを誤解や誤解を招くことなく分類し,結果のランダムなサブセットに対して検証する。
これに基づいて,誤解を招いたコーパス内のつぶやきの特性を,誤解を伴わないものと比較する。
この探索分析により、様々なmlモデルを用いてツイートを(非)ミスリーディングとして分類するために活用できる特徴(感情、ハッシュタグ、名詞、代名詞など)を説明可能な方法で設計することができる。
具体的には、最大90%の精度で予測にいくつかのMLモデルを使用し、SHAP Explainable AI(XAI)ツールを使用して、各機能の重要性を説明する。
本研究の推進力は、主に、コビッドウイルスの予防接種に関するオンライン談話の洞察を得るための探索的分析であるが、これらの知見が、誤情報を緩和するためのより実用的なアプローチの基盤となっていることを概説して、論文を締めくくる。
キュレートされたデータセットとコードは公開されており(Githubリポジトリ)、研究コミュニティ全体がこの作業を再現、比較、構築することができる。
関連論文リスト
- Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - 5q032e@SMM4H'22: Transformer-based classification of premise in tweets
related to COVID-19 [2.3931689873603603]
本研究では,Twitterテキストにおける前提の存在を分類するために,トランスフォーマーアーキテクチャに基づく予測モデルを提案する。
Twitterデータセットを用いた実験の結果,RoBERTaは前提予測タスクの場合,他のトランスフォーマーモデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-09-08T14:46:28Z) - Machine Learning-based Automatic Annotation and Detection of COVID-19
Fake News [8.020736472947581]
新型コロナウイルス(COVID-19)は世界のあらゆる地域に影響を与えるが、感染の誤報はウイルスよりも速く移動した。
既存の作業は、拡散の触媒として働くボットの存在を無視する。
そこで本稿では,Twitterデータセット上で事実確認文をラベル付けする手法を提案する。
論文 参考訳(メタデータ) (2022-09-07T13:55:59Z) - Rumor Detection with Self-supervised Learning on Texts and Social Graph [101.94546286960642]
異種情報ソース上での自己教師型学習を対照的に提案し,それらの関係を明らかにするとともに,噂をよりよく特徴付ける。
我々はこの枠組みをSRD(Self-supervised Rumor Detection)と呼ぶ。
3つの実世界のデータセットに対する大規模な実験により、ソーシャルメディア上での噂の自動検出におけるSRDの有効性が検証された。
論文 参考訳(メタデータ) (2022-04-19T12:10:03Z) - COVID-19 Tweets Analysis through Transformer Language Models [0.0]
本研究では、COVID-19におけるツイートの詳細な感情分析を行う。
訓練されたトランスフォーマーモデルは、ツイートのトーンを高精度で正確に予測することができる。
次にこのモデルを利用して、covid-19の20万ツイートのトーンを予測する。
論文 参考訳(メタデータ) (2021-02-27T12:06:33Z) - Team Alex at CLEF CheckThat! 2020: Identifying Check-Worthy Tweets With
Transformer Models [28.25006244616817]
本稿では、深い文脈のテキスト表現と、そのツイートの社会的文脈をモデル化した、新型コロナウイルスに関するチェックアワーなツイートを検出するモデルを提案する。
CLEF-2020 CheckThat! Task 1 System Team_AlexはMAPスコア0.8034で2位にランクされた。
論文 参考訳(メタデータ) (2020-09-07T08:03:21Z) - BANANA at WNUT-2020 Task 2: Identifying COVID-19 Information on Twitter
by Combining Deep Learning and Transfer Learning Models [0.0]
本稿では, WNUT-2020 Task 2: Identification of Informative COVID-19 English Tweetsについて述べる。
このタスクのデータセットには、人間によってラベル付けされた英語の1万のツイートが含まれている。
実験結果から, システム上でのインフォーマルラベルのF1は, テストセットで88.81%の精度で達成できたことが示唆された。
論文 参考訳(メタデータ) (2020-09-06T08:24:55Z) - Cross-lingual Transfer Learning for COVID-19 Outbreak Alignment [90.12602012910465]
われわれは、Twitterを通じてイタリアの新型コロナウイルス感染症(COVID-19)の早期流行を訓練し、他のいくつかの国に移る。
実験の結果,クロスカントリー予測において最大0.85のスピアマン相関が得られた。
論文 参考訳(メタデータ) (2020-06-05T02:04:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。