論文の概要: UrduFake@FIRE2020: Shared Track on Fake News Identification in Urdu
- arxiv url: http://arxiv.org/abs/2207.12406v1
- Date: Mon, 25 Jul 2022 03:46:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-27 12:35:47.674411
- Title: UrduFake@FIRE2020: Shared Track on Fake News Identification in Urdu
- Title(参考訳): UrduFake@FIRE2020: ウルドゥー語におけるフェイクニュース識別の共有トラック
- Authors: Maaz Amjad, Grigori Sidorov, Alisa Zhila, Alexander Gelbukh and Paolo
Rosso
- Abstract要約: 本稿では、ウルドゥー語における偽ニュース検出に関するFIRE 2020における最初の共有タスクの概要について述べる。
目標は、900の注釈付きニュース記事と400のニュース記事からなるデータセットを使って偽ニュースを特定することである。
データセットには、 (i) Health、 (ii) Sports、 (iii) Showbiz、 (iv) Technology、 (v) Businessの5つのドメインのニュースが含まれている。
- 参考スコア(独自算出の注目度): 62.6928395368204
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper gives the overview of the first shared task at FIRE 2020 on fake
news detection in the Urdu language. This is a binary classification task in
which the goal is to identify fake news using a dataset composed of 900
annotated news articles for training and 400 news articles for testing. The
dataset contains news in five domains: (i) Health, (ii) Sports, (iii) Showbiz,
(iv) Technology, and (v) Business. 42 teams from 6 different countries (India,
China, Egypt, Germany, Pakistan, and the UK) registered for the task. 9 teams
submitted their experimental results. The participants used various machine
learning methods ranging from feature-based traditional machine learning to
neural network techniques. The best performing system achieved an F-score value
of 0.90, showing that the BERT-based approach outperforms other machine
learning classifiers.
- Abstract(参考訳): 本稿では、ウルドゥー語における偽ニュース検出に関するFIRE 2020における最初の共有タスクの概要について述べる。
これは、900の注釈付きニュース記事と400のニュース記事からなるデータセットを使って偽ニュースを識別することを目的としているバイナリ分類タスクである。
データセットには5つのドメインのニュースが含まれている。
(i)健康。
(ii)スポーツ
(iii)ショービズ
(iv)技術、及び
(v)ビジネス。
6つの国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)から42チームが登録した。
9チームが実験結果を提出した。
参加者は、機能ベースの従来の機械学習からニューラルネットワーク技術まで、さまざまな機械学習手法を使用した。
最高のパフォーマンスシステムはFスコアの0.90を達成し、BERTベースのアプローチが他の機械学習分類器よりも優れていることを示した。
関連論文リスト
- Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Combination Of Convolution Neural Networks And Deep Neural Networks For
Fake News Detection [0.0]
我々は、フェイクニュースチャレンジのステージ#1データセットを説明し、フェイクニュース検知システムを構築するための競争的試みの概要を説明した。
提案システムは,不一致カテゴリを除くすべてのカテゴリを高精度に検出する。
その結果、このシステムは84.6%の精度を達成し、他の競合研究に基づいて第2位にランク付けされた。
論文 参考訳(メタデータ) (2022-10-15T16:32:51Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2020 [62.6928395368204]
タスクはバイナリ分類タスクとして設定され、ゴールはリアルニュースとフェイクニュースを区別することである。
トレーニング用に900の注釈付きニュース記事とテスト用に400のニュース記事のデータセットを作成した。
6カ国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)の42チームが登録された。
論文 参考訳(メタデータ) (2022-07-25T03:41:32Z) - UrduFake@FIRE2021: Shared Track on Fake News Identification in Urdu [55.41644538483948]
本研究は、ウルドゥー語で偽ニュースを検出するために、UrduFake@FIRE2021と名付けられた2番目の共有タスクを報告した。
提案システムは、様々なカウントベースの特徴に基づいており、異なる分類器とニューラルネットワークアーキテクチャを使用していた。
勾配降下(SGD)アルゴリズムは他の分類器よりも優れ、0.679Fスコアを達成した。
論文 参考訳(メタデータ) (2022-07-11T19:15:04Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2021 [55.41644538483948]
共有タスクの目標は、コミュニティにこの重要な問題を解決するための効率的な方法を考え出すことを動機付けることです。
トレーニングセットには1300件の注釈付きニュース記事、750件のリアルニュース、550件のフェイクニュース、300件のニュース記事、200件のリアルニュース、100件のフェイクニュースが含まれている。
F1-macroスコアは0.679で、これは過去最高の0.907 F1-macroよりも低かった。
論文 参考訳(メタデータ) (2022-07-11T18:58:36Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - BanFakeNews: A Dataset for Detecting Fake News in Bangla [1.4170999534105675]
自動フェイクニュース検知システムの構築に使用できる50Kニュースの注釈付きデータセットを提案する。
我々は,Bangla偽ニュースを識別するためのNLP技術の現状を示すベンチマークシステムを開発した。
論文 参考訳(メタデータ) (2020-04-19T07:42:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。