論文の概要: Not Good Times for Lies: Misinformation Detection on the Russia-Ukraine
War, COVID-19, and Refugees
- arxiv url: http://arxiv.org/abs/2210.05401v1
- Date: Tue, 11 Oct 2022 12:25:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 17:14:58.201325
- Title: Not Good Times for Lies: Misinformation Detection on the Russia-Ukraine
War, COVID-19, and Refugees
- Title(参考訳): ロシア・ウクライナ戦争、covid-19、難民の誤情報検出
- Authors: Cagri Toraman, Oguzhan Ozcelik, Furkan \c{S}ahinu\c{c}, Fazli Can
- Abstract要約: MiDe-22という,5,284の英語と5,064のトルコ語ツイートを誤報ラベル付きで構築した。
ユーザーエンゲージメントを、いいね!、リプライ、リツイート、引用という観点から提供します。
本稿では,記述統計と時間解析を併用した詳細なデータ解析を行い,新しいデータセットにおける誤情報検出のためのベンチマーク評価実験結果について報告する。
- 参考スコア(独自算出の注目度): 4.960805676180952
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Misinformation spread in online social networks is an urgent-to-solve problem
having harmful consequences that threaten human health, public safety,
economics, and so on. In this study, we construct a novel dataset, called
MiDe-22, having 5,284 English and 5,064 Turkish tweets with their
misinformation labels under several recent events, including the Russia-Ukraine
war, COVID-19 pandemic, and Refugees. Moreover, we provide the user engagements
to the tweets in terms of likes, replies, retweets, and quotes. We present a
detailed data analysis with descriptive statistics and temporal analysis, and
provide the experimental results of a benchmark evaluation for misinformation
detection on our novel dataset.
- Abstract(参考訳): オンラインソーシャルネットワークに拡散する誤報は、人間の健康、公衆安全、経済等を脅かす有害な結果をもたらす緊急解決問題である。
本研究では,ロシアとウクライナの戦争,新型コロナウイルスのパンデミック,難民などの最近の出来事において,英文5,284件,トルコ語5,064件のツイートに偽情報ラベルを付けた新しいデータセットMiDe-22を構築した。
さらに、likes、reply、retweets、およびquotesという観点で、ユーザのエンゲージメントをツイートに提供します。
本稿では,記述統計と時間解析を併用した詳細なデータ解析を行い,新しいデータセット上での誤情報検出のためのベンチマーク評価の結果について述べる。
関連論文リスト
- AMIR: Automated MisInformation Rebuttal -- A COVID-19 Vaccination
Datasets based Recommendation System [0.05461938536945722]
本研究は,ソーシャルメディアから得られる既存の情報を活用して,大規模な誤報の自動報知を容易にする方法について検討した。
FaCov(ファクトチェック記事)と誤解を招く(ソーシャルメディアTwitter)という、新型コロナウイルスワクチンに関する2つの公開データセットを活用している。
論文 参考訳(メタデータ) (2023-10-29T13:07:33Z) - A New Task and Dataset on Detecting Attacks on Human Rights Defenders [68.45906430323156]
我々は,500のオンラインニュース記事にクラウドソーシングされたアノテーションからなる人権擁護者に対する攻撃(HRDsAttack)を検出するための新しいデータセットを提案する。
アノテーションには、攻撃のタイプと場所に関する詳細な情報と、被害者に関する情報が含まれている。
いくつかのサブタスク上でベースラインモデルをトレーニングし,評価し,注釈付き特性を予測することで,データセットの有用性を実証する。
論文 参考訳(メタデータ) (2023-06-30T14:20:06Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on
Social Media [53.51665032295087]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Twitter Dataset on the Russo-Ukrainian War [68.713984286035]
Twitter APIから現在進行中のデータセットの取得を開始しています。
データセットは770万人のユーザーを起源とする5730万ツイートに達している。
我々は、最初のボリュームと感情分析を適用し、データセットはトピック分析、ヘイトスピーチ、プロパガンダ認識、ボットネットのような潜在的な悪意のあるエンティティを示すためにさらに探索的な調査に使用することができる。
論文 参考訳(メタデータ) (2022-04-07T12:33:06Z) - A Weibo Dataset for the 2022 Russo-Ukrainian Crisis [59.258530429699924]
我々は、最初のリリースで350万以上のユーザー投稿とコメントを含む、ロシア・ウクライナ危機Weiboデータセットを提示する。
我々のデータはhttps://github.com/yrf1/Russia-Ukraine_weibo_dataset.comから入手可能です。
論文 参考訳(メタデータ) (2022-03-09T19:06:04Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - AraCOVID19-MFH: Arabic COVID-19 Multi-label Fake News and Hate Speech
Detection Dataset [0.0]
「AraCOVID19-MFH」は、アラビア・COVID-19の偽ニュースとヘイトスピーチ検出データセットを手動で注釈付けしたものである。
当社のデータセットには、10の異なるラベルで注釈付けされた10,828のアラビア語ツイートが含まれています。
ヘイトスピーチの検出、意見/ニュースの分類、方言の識別、その他多くのタスクにも使用できる。
論文 参考訳(メタデータ) (2021-05-07T09:52:44Z) - ArCOV19-Rumors: Arabic COVID-19 Twitter Dataset for Misinformation
Detection [6.688963029270579]
ArCOV19-Rumorsは、1月27日から2020年4月末までのクレームを含むツイートからなる誤情報検出のためのアラビア語のTwitterデータセットである。
本誌は138件の確認済みのクレームを、主に人気ファクトチェックサイトから収集し、それらのクレームに関連する9.4万件のツイートを特定した。
ツイートは、パンデミックで直面した主要な問題の一つである誤情報検出の研究を支援するために、正確さで手動で注釈付けされた。
論文 参考訳(メタデータ) (2020-10-17T11:21:40Z) - Characterizing COVID-19 Misinformation Communities Using a Novel Twitter
Dataset [9.60966128833701]
競合する2つの誤報コミュニティを特徴付けるための方法論と分析について述べる。
我々の分析によると、新型コロナウイルスの誤報されたコミュニティは、情報のあるコミュニティよりも密集し、組織化されている。
我々の社会言語学的分析は、新型コロナウイルスに通知されたユーザーは誤報されたユーザーよりも多くの物語を使う傾向があることを示唆している。
論文 参考訳(メタデータ) (2020-08-03T11:44:22Z) - Misinformation Has High Perplexity [55.47422012881148]
疑似クレームを教師なしの方法でデバンクするために, 難易度を活用することを提案する。
まず,これらの主張に類似した文に基づいて,科学的およびニュースソースから信頼性のある証拠を抽出する。
第2に,抽出したエビデンスを言語モデルにプライマリし,難易度スコアに基づいて与えられたクレームの正当性を評価する。
論文 参考訳(メタデータ) (2020-06-08T15:13:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。