論文の概要: Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2021
- arxiv url: http://arxiv.org/abs/2207.05133v1
- Date: Mon, 11 Jul 2022 18:58:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 05:03:46.503605
- Title: Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2021
- Title(参考訳): fire 2021におけるurduにおける偽ニュース検出に関する共通課題の概要
- Authors: Maaz Amjad, Sabur Butt, Hamza Imam Amjad, Alisa Zhila, Grigori
Sidorov, Alexander Gelbukh
- Abstract要約: 共有タスクの目標は、コミュニティにこの重要な問題を解決するための効率的な方法を考え出すことを動機付けることです。
トレーニングセットには1300件の注釈付きニュース記事、750件のリアルニュース、550件のフェイクニュース、300件のニュース記事、200件のリアルニュース、100件のフェイクニュースが含まれている。
F1-macroスコアは0.679で、これは過去最高の0.907 F1-macroよりも低かった。
- 参考スコア(独自算出の注目度): 55.41644538483948
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic detection of fake news is a highly important task in the
contemporary world. This study reports the 2nd shared task called
UrduFake@FIRE2021 on identifying fake news detection in Urdu. The goal of the
shared task is to motivate the community to come up with efficient methods for
solving this vital problem, particularly for the Urdu language. The task is
posed as a binary classification problem to label a given news article as a
real or a fake news article. The organizers provide a dataset comprising news
in five domains: (i) Health, (ii) Sports, (iii) Showbiz, (iv) Technology, and
(v) Business, split into training and testing sets. The training set contains
1300 annotated news articles -- 750 real news, 550 fake news, while the testing
set contains 300 news articles -- 200 real, 100 fake news. 34 teams from 7
different countries (China, Egypt, Israel, India, Mexico, Pakistan, and UAE)
registered to participate in the UrduFake@FIRE2021 shared task. Out of those,
18 teams submitted their experimental results, and 11 of those submitted their
technical reports, which is substantially higher compared to the UrduFake
shared task in 2020 when only 6 teams submitted their technical reports. The
technical reports submitted by the participants demonstrated different data
representation techniques ranging from count-based BoW features to word vector
embeddings as well as the use of numerous machine learning algorithms ranging
from traditional SVM to various neural network architectures including
Transformers such as BERT and RoBERTa. In this year's competition, the best
performing system obtained an F1-macro score of 0.679, which is lower than the
past year's best result of 0.907 F1-macro. Admittedly, while training sets from
the past and the current years overlap to a large extent, the testing set
provided this year is completely different.
- Abstract(参考訳): 偽ニュースの自動検出は現代世界では非常に重要な課題である。
本研究では、urdufake@fire2021と呼ばれる第2の共有タスクについて報告する。
共有タスクの目標は、特にウルドゥー語において、この重要な問題を解決する効率的な方法を考え出すことをコミュニティに動機付けることである。
このタスクは、与えられたニュース記事を実または偽のニュース記事としてラベル付けするバイナリ分類問題として提起される。
主催者は5つのドメインからなるニュースからなるデータセットを提供する。
(i)健康。
(ii)スポーツ
(iii)ショービズ
(iv)技術、及び
(v)ビジネス、トレーニングとテストセットに分かれる。
トレーニングセットには1300の注釈付ニュース記事(750のリアルニュース、550のフェイクニュース)と300のニュース記事(200のリアルニュース、100の偽ニュース)が含まれている。
7カ国(中国、エジプト、イスラエル、インド、メキシコ、パキスタン、アラブ首長国連邦)の34チームがUrduFake@FIRE2021の共有タスクに参加した。
そのうち18チームが実験結果を提出し、そのうち11チームがテクニカルレポートを提出した。
参加者が提出した技術レポートでは、カウントベースのBoW機能からワードベクトル埋め込み、従来のSVMからBERTやRoBERTaなどのトランスフォーマーを含むさまざまなニューラルネットワークアーキテクチャまで、数多くの機械学習アルゴリズムの使用など、さまざまなデータ表現テクニックが実証された。
今年の競技では、ベストパフォーマンスシステムはF1-macroスコア0.679を獲得し、これは過去最高スコア0.907 F1-macroよりも低かった。
確かに、過去から現在までのトレーニングセットは、かなり重複しているが、今年提供されたテストセットは完全に異なる。
関連論文リスト
- Findings of Factify 2: Multimodal Fake News Detection [36.34201719103715]
本稿では,マルチモーダルな事実検証と風刺ニュースデータセットを提供するFactify 2共有タスクの結果を示す。
このデータでは,マルチモーダル関係に基づく5つのクラスに分けて,ソーシャルメディアの主張をテキストと画像の両方で支援文書と組み合わせることで,タスクに対する比較に基づくアプローチが求められている。
全5クラスの平均得点は81.82%であった。
論文 参考訳(メタデータ) (2023-07-19T22:14:49Z) - Combination Of Convolution Neural Networks And Deep Neural Networks For
Fake News Detection [0.0]
我々は、フェイクニュースチャレンジのステージ#1データセットを説明し、フェイクニュース検知システムを構築するための競争的試みの概要を説明した。
提案システムは,不一致カテゴリを除くすべてのカテゴリを高精度に検出する。
その結果、このシステムは84.6%の精度を達成し、他の競合研究に基づいて第2位にランク付けされた。
論文 参考訳(メタデータ) (2022-10-15T16:32:51Z) - UrduFake@FIRE2020: Shared Track on Fake News Identification in Urdu [62.6928395368204]
本稿では、ウルドゥー語における偽ニュース検出に関するFIRE 2020における最初の共有タスクの概要について述べる。
目標は、900の注釈付きニュース記事と400のニュース記事からなるデータセットを使って偽ニュースを特定することである。
データセットには、 (i) Health、 (ii) Sports、 (iii) Showbiz、 (iv) Technology、 (v) Businessの5つのドメインのニュースが含まれている。
論文 参考訳(メタデータ) (2022-07-25T03:46:51Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2020 [62.6928395368204]
タスクはバイナリ分類タスクとして設定され、ゴールはリアルニュースとフェイクニュースを区別することである。
トレーニング用に900の注釈付きニュース記事とテスト用に400のニュース記事のデータセットを作成した。
6カ国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)の42チームが登録された。
論文 参考訳(メタデータ) (2022-07-25T03:41:32Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - UrduFake@FIRE2021: Shared Track on Fake News Identification in Urdu [55.41644538483948]
本研究は、ウルドゥー語で偽ニュースを検出するために、UrduFake@FIRE2021と名付けられた2番目の共有タスクを報告した。
提案システムは、様々なカウントベースの特徴に基づいており、異なる分類器とニューラルネットワークアーキテクチャを使用していた。
勾配降下(SGD)アルゴリズムは他の分類器よりも優れ、0.679Fスコアを達成した。
論文 参考訳(メタデータ) (2022-07-11T19:15:04Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。