論文の概要: Factify 2: A Multimodal Fake News and Satire News Dataset
- arxiv url: http://arxiv.org/abs/2304.03897v2
- Date: Mon, 2 Oct 2023 14:48:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-03 19:35:34.533657
- Title: Factify 2: A Multimodal Fake News and Satire News Dataset
- Title(参考訳): factify 2: マルチモーダルな偽ニュースと風刺ニュースデータセット
- Authors: S Suryavardan, Shreyash Mishra, Parth Patwa, Megha Chakraborty, Anku
Rani, Aishwarya Reganti, Aman Chadha, Amitava Das, Amit Sheth, Manoj
Chinnakotla, Asif Ekbal, Srijan Kumar
- Abstract要約: 我々は、FACTIFY 2と呼ばれるマルチモーダルなファクトチェックデータセットを提供し、新しいデータソースを使用してFactify 1を改善し、風刺記事を追加する。
FACTIFY 1.0と同様に、私たちは3つの幅広いカテゴリ、すなわち、サポート、証拠なし、反響があり、視覚的およびテキスト的データの詳細に基づいたサブカテゴリがあります。
BERT と Vison Transformer ベースのベースラインも提供しています。
- 参考スコア(独自算出の注目度): 36.34201719103715
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The internet gives the world an open platform to express their views and
share their stories. While this is very valuable, it makes fake news one of our
society's most pressing problems. Manual fact checking process is time
consuming, which makes it challenging to disprove misleading assertions before
they cause significant harm. This is he driving interest in automatic fact or
claim verification. Some of the existing datasets aim to support development of
automating fact-checking techniques, however, most of them are text based.
Multi-modal fact verification has received relatively scant attention. In this
paper, we provide a multi-modal fact-checking dataset called FACTIFY 2,
improving Factify 1 by using new data sources and adding satire articles.
Factify 2 has 50,000 new data instances. Similar to FACTIFY 1.0, we have three
broad categories - support, no-evidence, and refute, with sub-categories based
on the entailment of visual and textual data. We also provide a BERT and Vison
Transformer based baseline, which achieves 65% F1 score in the test set. The
baseline codes and the dataset will be made available at
https://github.com/surya1701/Factify-2.0.
- Abstract(参考訳): インターネットは世界に対し、自分の見解を表現し、ストーリーを共有するためのオープンなプラットフォームを提供します。
これは非常に価値があるが、偽ニュースは社会の最も差し迫った問題の一つとなっている。
手動の事実チェックプロセスは時間を要するため、重大な害を引き起こす前に誤解を招く主張を否定することは困難である。
これは自動事実またはクレーム検証への関心を喚起している。
既存のデータセットのいくつかは、ファクトチェックの自動化技術の開発をサポートすることを目的としているが、その多くはテキストベースである。
マルチモーダルな事実検証は比較的注目されている。
本稿では,新たなデータソースと風刺記事の追加により,factify 2 と呼ばれるマルチモーダルファクトチェックデータセットを提供する。
factify 2には50,000の新しいデータインスタンスがある。
FACTIFY 1.0と同様に、私たちは3つの幅広いカテゴリ、すなわち、サポート、証拠なし、反響があり、視覚的およびテキスト的データの詳細に基づいたサブカテゴリがあります。
bert and vison transformerベースのベースラインも提供し,テストセットで65%のf1スコアを達成した。
ベースラインコードとデータセットはhttps://github.com/surya1701/Factify-2.0で公開される。
関連論文リスト
- Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - Findings of Factify 2: Multimodal Fake News Detection [36.34201719103715]
本稿では,マルチモーダルな事実検証と風刺ニュースデータセットを提供するFactify 2共有タスクの結果を示す。
このデータでは,マルチモーダル関係に基づく5つのクラスに分けて,ソーシャルメディアの主張をテキストと画像の両方で支援文書と組み合わせることで,タスクに対する比較に基づくアプローチが求められている。
全5クラスの平均得点は81.82%であった。
論文 参考訳(メタデータ) (2023-07-19T22:14:49Z) - Give Me More Details: Improving Fact-Checking with Latent Retrieval [58.706972228039604]
証拠は、自動化された事実チェックにおいて重要な役割を果たす。
既存のファクトチェックシステムは、エビデンス文が与えられたと仮定するか、検索エンジンが返した検索スニペットを使用する。
資料から得られた全文を証拠として組み込んで,2つの豊富なデータセットを導入することを提案する。
論文 参考訳(メタデータ) (2023-05-25T15:01:19Z) - INO at Factify 2: Structure Coherence based Multi-Modal Fact
Verification [3.5408382050384883]
疑似ニュースを分類する構造コヒーレンスに基づくマルチモーダル事実検証手法を提案する。
我々の重み付き平均F1スコアは0.8079に達し、FACTIFY2で2位となった。
論文 参考訳(メタデータ) (2023-03-02T11:18:56Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Combination Of Convolution Neural Networks And Deep Neural Networks For
Fake News Detection [0.0]
我々は、フェイクニュースチャレンジのステージ#1データセットを説明し、フェイクニュース検知システムを構築するための競争的試みの概要を説明した。
提案システムは,不一致カテゴリを除くすべてのカテゴリを高精度に検出する。
その結果、このシステムは84.6%の精度を達成し、他の競合研究に基づいて第2位にランク付けされた。
論文 参考訳(メタデータ) (2022-10-15T16:32:51Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2021 [55.41644538483948]
共有タスクの目標は、コミュニティにこの重要な問題を解決するための効率的な方法を考え出すことを動機付けることです。
トレーニングセットには1300件の注釈付きニュース記事、750件のリアルニュース、550件のフェイクニュース、300件のニュース記事、200件のリアルニュース、100件のフェイクニュースが含まれている。
F1-macroスコアは0.679で、これは過去最高の0.907 F1-macroよりも低かった。
論文 参考訳(メタデータ) (2022-07-11T18:58:36Z) - CHEF: A Pilot Chinese Dataset for Evidence-Based Fact-Checking [55.75590135151682]
CHEFは、10万件の現実世界のクレームに関する最初のChenese EvidenceベースのFact-checkingデータセットである。
このデータセットは、政治から公衆衛生まで、複数のドメインをカバーし、インターネットから取得した注釈付きの証拠を提供する。
論文 参考訳(メタデータ) (2022-06-06T09:11:03Z) - NoFake at CheckThat! 2021: Fake News Detection Using BERT [0.0]
我々は、領域と分類を予測するためにBERTに基づく分類モデルを提示した。
我々は、追加のトレーニングデータを用いて、タスク3Aでは83.76%、タスク3Bでは85.55%というマクロF1スコアを達成した。
論文 参考訳(メタデータ) (2021-08-11T19:13:04Z) - Two Stage Transformer Model for COVID-19 Fake News Detection and Fact
Checking [0.3441021278275805]
我々は、自然言語処理のための機械学習モデルの状態を用いて、新型コロナウイルスの偽ニュース検出のための2段階の自動パイプラインを開発する。
最初のモデルは、新型コロナウイルス(COVID-19)の特定のクレームに関するユーザーのクレームに関する最も関連性の高い事実を検索する、新しい事実チェックアルゴリズムを活用する。
第2のモデルは、クレームと、手動でキュレートされたCOVID-19データセットから取得した真事実の間のテキストの関連性を計算することによって、クレームの真理レベルを検証する。
論文 参考訳(メタデータ) (2020-11-26T11:50:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。