論文の概要: The COVMis-Stance dataset: Stance Detection on Twitter for COVID-19
Misinformation
- arxiv url: http://arxiv.org/abs/2204.02000v1
- Date: Tue, 5 Apr 2022 05:47:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 21:12:37.688574
- Title: The COVMis-Stance dataset: Stance Detection on Twitter for COVID-19
Misinformation
- Title(参考訳): covmis-stanceデータセット:covid-19の誤った情報に対するtwitterのスタンス検出
- Authors: Yanfang Hou, Peter van der Putten, Suzan Verberne
- Abstract要約: 新型コロナウイルス(COVID-19)のパンデミックの間、ソーシャルメディアでは大量の誤報が拡散している。
新型コロナウイルスの誤報に対する姿勢を示す2631のツイートからなる新しいスタンスデータセットを構築した。
実験結果から,MNLIデータセット上で逐次微調整を行った場合,モデルが最良であることを示す。
- 参考スコア(独自算出の注目度): 3.9533044769534444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: During the COVID-19 pandemic, large amounts of COVID-19 misinformation are
spreading on social media. We are interested in the stance of Twitter users
towards COVID-19 misinformation. However, due to the relative recent nature of
the pandemic, only a few stance detection datasets fit our task. We have
constructed a new stance dataset consisting of 2631 tweets annotated with the
stance towards COVID-19 misinformation. In contexts with limited labeled data,
we fine-tune our models by leveraging the MNLI dataset and two existing stance
detection datasets (RumourEval and COVIDLies), and evaluate the model
performance on our dataset. Our experimental results show that the model
performs the best when fine-tuned sequentially on the MNLI dataset and the
combination of the undersampled RumourEval and COVIDLies datasets. Our code and
dataset are publicly available at
https://github.com/yanfangh/covid-rumor-stance
- Abstract(参考訳): 新型コロナウイルス(COVID-19)のパンデミックの間、ソーシャルメディアでは大量の誤報が拡散している。
私たちはtwitterユーザーの新型コロナウイルス(covid-19)誤報に対するスタンスに興味があります。
しかし、パンデミックの比較的最近の性質から、私たちのタスクに適合するスタンス検出データセットはごくわずかです。
新型コロナウイルスの誤報に対する姿勢を示す2631のツイートからなる新しいスタンスデータセットを構築した。
ラベル付きデータに制限のあるコンテキストでは、MNLIデータセットと既存の2つのスタンス検出データセット(RumourEvalとCOVIDLies)を活用してモデルを微調整し、データセット上でのモデルパフォーマンスを評価する。
実験の結果,MNLIデータセットとアンダーサンプリングされたRumourEvalデータセットとCOVIDLiesデータセットの組み合わせを連続的に微調整すると,モデルが最高の性能を示すことがわかった。
私たちのコードとデータセットはhttps://github.com/yanfangh/covid-rumor-stanceで公開されている。
関連論文リスト
- UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - Evaluating Graph Neural Networks for Link Prediction: Current Pitfalls
and New Benchmarking [66.83273589348758]
リンク予測は、グラフのエッジの一部のみに基づいて、目に見えないエッジが存在するかどうかを予測しようとする。
近年,この課題にグラフニューラルネットワーク(GNN)を活用すべく,一連の手法が導入されている。
これらの新しいモデルの有効性をよりよく評価するために、新しい多様なデータセットも作成されている。
論文 参考訳(メタデータ) (2023-06-18T01:58:59Z) - Not cool, calm or collected: Using emotional language to detect COVID-19
misinformation [0.0]
ツイッターなどのソーシャルメディアプラットフォーム上での新型コロナウイルス(COVID-19)の誤報は、効果的なパンデミック管理の脅威だ。
我々は、ツイート感情エンコーダと、ツイートに新型コロナウイルスの誤情報が含まれているかどうかを予測するために、ツイート感情エンコーダと、ツイート誤情報エンコーダの両方を使用する、新しい新型コロナウイルス誤情報モデルを提案する。
論文 参考訳(メタデータ) (2023-03-27T22:24:05Z) - Unified Visual Relationship Detection with Vision and Language Models [89.77838890788638]
この研究は、複数のデータセットからラベル空間の結合を予測する単一の視覚的関係検出器のトレーニングに焦点を当てている。
視覚と言語モデルを活用した統合視覚関係検出のための新しいボトムアップ手法UniVRDを提案する。
人物体間相互作用検出とシーングラフ生成の双方による実験結果から,本モデルの競合性能が示された。
論文 参考訳(メタデータ) (2023-03-16T00:06:28Z) - Self-Supervised Neural Architecture Search for Imbalanced Datasets [129.3987858787811]
ニューラルアーキテクチャサーチ(NAS)は、アノテートラベル付きよく計算されたデータセットでトレーニングされた場合、最先端の結果を提供する。
a) アーキテクチャを決定するためにラベルを必要とせず、(b) データセットが不均衡であると仮定する自己管理シナリオに焦点を当てたNASベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-17T14:56:36Z) - Unsupervised Text Mining of COVID-19 Records [0.0]
Twitterは、研究者が新型コロナウイルス(COVID-19)に反応して公衆衛生を測定するのに役立つ強力なツールだ。
本稿は、CORD-19と命名された新型コロナウイルスに関する既存の医療データセットを前処理し、教師付き分類タスクのためのデータセットを注釈付けした。
論文 参考訳(メタデータ) (2021-09-08T05:57:22Z) - Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。
Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。
また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文 参考訳(メタデータ) (2021-06-01T22:33:53Z) - Combat COVID-19 Infodemic Using Explainable Natural Language Processing
Models [15.782463163357976]
新型コロナの誤報対策として,DistilBERTとSHAPに基づく説明可能な自然言語処理モデルを提案する。
その結果は、新型コロナウイルスの誤報の検出と公衆の信頼向上に良い影響を与えました。
論文 参考訳(メタデータ) (2021-03-01T04:28:39Z) - Mega-COV: A Billion-Scale Dataset of 100+ Languages for COVID-19 [7.030105924295838]
Mega-COVは、Twitterが新型コロナウイルスを研究するための10億ドル規模のデータセットだ。
データセットは多種多様(268か国をカバー)、縦(2007年に遡る)、多言語(100言語以上)、そしてかなりの数の位置情報にタグ付けされたつぶやき(169万ツイート)がある。
1つは、ツイートがパンデミックと関連しているかどうか(ベストF1=97%)、もう1つは、新型コロナウイルス(ベストF1=92%)の誤情報を検出するための強力なモデルを開発し、リリースする。
論文 参考訳(メタデータ) (2020-05-02T10:23:27Z) - Rapidly Bootstrapping a Question Answering Dataset for COVID-19 [88.86456834766288]
我々は、新型コロナウイルスに特化して設計された質問応答データセットの始まりであるCovidQAを紹介する。
これは、そのタイプの最初の公開リソースであり、より実質的な評価資源が利用可能になるまで研究を導くためのストップギャップとして意図されている。
論文 参考訳(メタデータ) (2020-04-23T17:35:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。