論文の概要: Not Good Times for Lies: Misinformation Detection on the Russia-Ukraine
War, COVID-19, and Refugees
- arxiv url: http://arxiv.org/abs/2210.05401v1
- Date: Tue, 11 Oct 2022 12:25:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 17:14:58.201325
- Title: Not Good Times for Lies: Misinformation Detection on the Russia-Ukraine
War, COVID-19, and Refugees
- Title(参考訳): ロシア・ウクライナ戦争、covid-19、難民の誤情報検出
- Authors: Cagri Toraman, Oguzhan Ozcelik, Furkan \c{S}ahinu\c{c}, Fazli Can
- Abstract要約: MiDe-22という,5,284の英語と5,064のトルコ語ツイートを誤報ラベル付きで構築した。
ユーザーエンゲージメントを、いいね!、リプライ、リツイート、引用という観点から提供します。
本稿では,記述統計と時間解析を併用した詳細なデータ解析を行い,新しいデータセットにおける誤情報検出のためのベンチマーク評価実験結果について報告する。
- 参考スコア(独自算出の注目度): 4.960805676180952
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Misinformation spread in online social networks is an urgent-to-solve problem
having harmful consequences that threaten human health, public safety,
economics, and so on. In this study, we construct a novel dataset, called
MiDe-22, having 5,284 English and 5,064 Turkish tweets with their
misinformation labels under several recent events, including the Russia-Ukraine
war, COVID-19 pandemic, and Refugees. Moreover, we provide the user engagements
to the tweets in terms of likes, replies, retweets, and quotes. We present a
detailed data analysis with descriptive statistics and temporal analysis, and
provide the experimental results of a benchmark evaluation for misinformation
detection on our novel dataset.
- Abstract(参考訳): オンラインソーシャルネットワークに拡散する誤報は、人間の健康、公衆安全、経済等を脅かす有害な結果をもたらす緊急解決問題である。
本研究では,ロシアとウクライナの戦争,新型コロナウイルスのパンデミック,難民などの最近の出来事において,英文5,284件,トルコ語5,064件のツイートに偽情報ラベルを付けた新しいデータセットMiDe-22を構築した。
さらに、likes、reply、retweets、およびquotesという観点で、ユーザのエンゲージメントをツイートに提供します。
本稿では,記述統計と時間解析を併用した詳細なデータ解析を行い,新しいデータセット上での誤情報検出のためのベンチマーク評価の結果について述べる。
関連論文リスト
- CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - A New Task and Dataset on Detecting Attacks on Human Rights Defenders [68.45906430323156]
我々は,500のオンラインニュース記事にクラウドソーシングされたアノテーションからなる人権擁護者に対する攻撃(HRDsAttack)を検出するための新しいデータセットを提案する。
アノテーションには、攻撃のタイプと場所に関する詳細な情報と、被害者に関する情報が含まれている。
いくつかのサブタスク上でベースラインモデルをトレーニングし,評価し,注釈付き特性を予測することで,データセットの有用性を実証する。
論文 参考訳(メタデータ) (2023-06-30T14:20:06Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Two-Stage Classifier for COVID-19 Misinformation Detection Using BERT: a
Study on Indonesian Tweets [0.15229257192293202]
インドネシアでの新型コロナウイルスの誤情報検出に関する研究はいまだに少ない。
本研究では,ツイート誤報検出タスクに対して,IndoBERT事前学習言語モデルを用いた2段階分類モデルを提案する。
実験の結果、関連予測のためのBERTシーケンス分類器と誤情報検出のためのBi-LSTMの組み合わせは、87.02%の精度で他の機械学習モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-06-30T15:33:20Z) - Twitter Dataset on the Russo-Ukrainian War [68.713984286035]
Twitter APIから現在進行中のデータセットの取得を開始しています。
データセットは770万人のユーザーを起源とする5730万ツイートに達している。
我々は、最初のボリュームと感情分析を適用し、データセットはトピック分析、ヘイトスピーチ、プロパガンダ認識、ボットネットのような潜在的な悪意のあるエンティティを示すためにさらに探索的な調査に使用することができる。
論文 参考訳(メタデータ) (2022-04-07T12:33:06Z) - A Weibo Dataset for the 2022 Russo-Ukrainian Crisis [59.258530429699924]
我々は、最初のリリースで350万以上のユーザー投稿とコメントを含む、ロシア・ウクライナ危機Weiboデータセットを提示する。
我々のデータはhttps://github.com/yrf1/Russia-Ukraine_weibo_dataset.comから入手可能です。
論文 参考訳(メタデータ) (2022-03-09T19:06:04Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - TBCOV: Two Billion Multilingual COVID-19 Tweets with Sentiment, Entity,
Geo, and Gender Labels [5.267993069044648]
この研究は、新型コロナウイルス(COVID-19)のパンデミックに関連する20億以上の多言語ツイートを1年以上にわたって収集した大規模なTwitterデータセットTBCOVを提示する。
いくつかの最先端のディープラーニングモデルは、感情ラベル、名前付きエンティティ、人物の言及、組織、場所、ユーザータイプ、性別情報など、重要な属性でデータを強化するために使用される。
我々の感情と傾向分析は興味深い洞察を示し、TBCOVが重要なトピックを幅広くカバーしていることを確認する。
論文 参考訳(メタデータ) (2021-10-04T06:17:12Z) - BLM-17m: A Large-Scale Dataset for Black Lives Matter Topic Detection on
Twitter [25.881740515679393]
我々は,1700万ツイートを含むトピック検出のためのラベル付きデータセットを提案する。
これらのツイートは、2020年5月25日から8月21日までの89日間に収集される。
論文 参考訳(メタデータ) (2021-05-04T07:27:42Z) - Predicting Misinformation and Engagement in COVID-19 Twitter Discourse
in the First Months of the Outbreak [1.2059055685264957]
新型コロナウイルス(COVID-19)関連ツイート50万件近くを調べ、ボット行動とエンゲージメントの機能として誤情報を理解する。
実際のユーザーは事実と誤情報の両方をツイートし、ボットは偽情報よりも比例的にツイートしていることがわかった。
論文 参考訳(メタデータ) (2020-12-03T18:47:34Z) - ArCOV19-Rumors: Arabic COVID-19 Twitter Dataset for Misinformation
Detection [6.688963029270579]
ArCOV19-Rumorsは、1月27日から2020年4月末までのクレームを含むツイートからなる誤情報検出のためのアラビア語のTwitterデータセットである。
本誌は138件の確認済みのクレームを、主に人気ファクトチェックサイトから収集し、それらのクレームに関連する9.4万件のツイートを特定した。
ツイートは、パンデミックで直面した主要な問題の一つである誤情報検出の研究を支援するために、正確さで手動で注釈付けされた。
論文 参考訳(メタデータ) (2020-10-17T11:21:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。