論文の概要: Findings of the NLP4IF-2021 Shared Tasks on Fighting the COVID-19
Infodemic and Censorship Detection
- arxiv url: http://arxiv.org/abs/2109.12986v1
- Date: Thu, 23 Sep 2021 06:38:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:46:38.510043
- Title: Findings of the NLP4IF-2021 Shared Tasks on Fighting the COVID-19
Infodemic and Censorship Detection
- Title(参考訳): nlp4if-2021における新型コロナウイルスインフォデミック対策と検閲対策の共通課題
- Authors: Shaden Shaar, Firoj Alam, Giovanni Da San Martino, Alex Nikolov, Wajdi
Zaghouani, Preslav Nakov, Anna Feldman
- Abstract要約: NLP4IF-2021共有タスクの結果を示す。
10チームがタスク1にシステムを提出し、1チームがタスク2に参加した。
最高のシステムは、事前訓練されたトランスフォーマーとアンサンブルを使用する。
- 参考スコア(独自算出の注目度): 23.280506220186425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the results and the main findings of the NLP4IF-2021 shared tasks.
Task 1 focused on fighting the COVID-19 infodemic in social media, and it was
offered in Arabic, Bulgarian, and English. Given a tweet, it asked to predict
whether that tweet contains a verifiable claim, and if so, whether it is likely
to be false, is of general interest, is likely to be harmful, and is worthy of
manual fact-checking; also, whether it is harmful to society, and whether it
requires the attention of policy makers. Task~2 focused on censorship
detection, and was offered in Chinese. A total of ten teams submitted systems
for task 1, and one team participated in task 2; nine teams also submitted a
system description paper. Here, we present the tasks, analyze the results, and
discuss the system submissions and the methods they used. Most submissions
achieved sizable improvements over several baselines, and the best systems used
pre-trained Transformers and ensembles. The data, the scorers and the
leaderboards for the tasks are available at
http://gitlab.com/NLP4IF/nlp4if-2021.
- Abstract(参考訳): NLP4IF-2021共有タスクの結果と主な成果を報告する。
タスク1はソーシャルメディアで新型コロナウイルスのインフォデミックと戦うことに焦点を当て、アラビア語、ブルガリア語、英語で提供された。
ツイートをすると、そのツイートが検証可能なクレームを含んでいるかどうかを予測し、もしそうであれば、それが偽である可能性があり、一般的に利益があり、有害であり、手作業による事実確認に値する可能性があり、社会に有害であるかどうか、政策立案者の注意が必要であるかどうかを判断した。
Task~2は検閲検出に焦点を当て、中国語で提供された。
合計10チームがタスク1のシステムに参加し、1チームがタスク2に参加し、9チームがシステム記述の論文を提出した。
ここでは,タスクを提示し,結果を解析し,システム提案と使用する方法について議論する。
ほとんどの投稿はいくつかのベースラインに対して相当な改善を達成し、最良のシステムは事前訓練されたトランスフォーマーとアンサンブルを使用した。
データ、スコア、タスクのリーダーボードはhttp://gitlab.com/NLP4IF/nlp4if-2021で入手できる。
関連論文リスト
- Mavericks at ArAIEval Shared Task: Towards a Safer Digital Space --
Transformer Ensemble Models Tackling Deception and Persuasion [0.0]
本稿では,各課題のタスク1-Aとタスク2-Aのアプローチについて述べる。
タスクは、与えられたバイナリ分類問題に対して、ツイートとニュース記事のマルチジャンルスニペットを使用する。
タスク1-A(8位)では0.742、タスク2-A(7位)では0.901のマイクロF1スコアを達成した。
論文 参考訳(メタデータ) (2023-11-30T17:26:57Z) - ArAIEval Shared Task: Persuasion Techniques and Disinformation Detection
in Arabic Text [41.3267575540348]
本稿では, EMNLP 2023と共同で開催される第1回アラビア2023会議の一環として組織されたArAIEval共有タスクの概要を紹介する。
ArAIEvalは、アラビア文字上の2つのタスクを提供する: (i) 説得テクニックの検出、ツイートやニュース記事における説得テクニックの識別、および (ii) ツイート上のバイナリとマルチクラスの設定における偽情報検出。
最終評価フェーズには合計20チームが参加し、タスク1と2には14チームと16チームが参加した。
論文 参考訳(メタデータ) (2023-11-06T15:21:19Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - QCRI at SemEval-2023 Task 3: News Genre, Framing and Persuasion
Techniques Detection using Multilingual Models [20.003175365478228]
本稿では,SemEval-2023タスク3への参加システムについて述べる。
このタスクは、サプライズテスト言語に加えて、6つの言語を持つ3つのサブタスクに対処し、27の異なるテスト設定を実現した。
当社のシステムは,27のセットアップ中10の上位3システムにランクインしている。
論文 参考訳(メタデータ) (2023-05-05T07:40:41Z) - Findings of the WMT 2022 Shared Task on Translation Suggestion [63.457874930232926]
We report the results of the first edition of the WMT shared task on Translation Suggestion。
このタスクは、機械翻訳(MT)によって生成された文書全体に対して、特定の単語やフレーズの代替手段を提供することを目的としている。
2つのサブタスク、すなわち単純翻訳提案と暗示付き翻訳提案で構成されている。
論文 参考訳(メタデータ) (2022-11-30T03:48:36Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2020 [62.6928395368204]
タスクはバイナリ分類タスクとして設定され、ゴールはリアルニュースとフェイクニュースを区別することである。
トレーニング用に900の注釈付きニュース記事とテスト用に400のニュース記事のデータセットを作成した。
6カ国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)の42チームが登録された。
論文 参考訳(メタデータ) (2022-07-25T03:41:32Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - UrduFake@FIRE2021: Shared Track on Fake News Identification in Urdu [55.41644538483948]
本研究は、ウルドゥー語で偽ニュースを検出するために、UrduFake@FIRE2021と名付けられた2番目の共有タスクを報告した。
提案システムは、様々なカウントベースの特徴に基づいており、異なる分類器とニューラルネットワークアーキテクチャを使用していた。
勾配降下(SGD)アルゴリズムは他の分類器よりも優れ、0.679Fスコアを達成した。
論文 参考訳(メタデータ) (2022-07-11T19:15:04Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2021 [55.41644538483948]
共有タスクの目標は、コミュニティにこの重要な問題を解決するための効率的な方法を考え出すことを動機付けることです。
トレーニングセットには1300件の注釈付きニュース記事、750件のリアルニュース、550件のフェイクニュース、300件のニュース記事、200件のリアルニュース、100件のフェイクニュースが含まれている。
F1-macroスコアは0.679で、これは過去最高の0.907 F1-macroよりも低かった。
論文 参考訳(メタデータ) (2022-07-11T18:58:36Z) - Team Alex at CLEF CheckThat! 2020: Identifying Check-Worthy Tweets With
Transformer Models [28.25006244616817]
本稿では、深い文脈のテキスト表現と、そのツイートの社会的文脈をモデル化した、新型コロナウイルスに関するチェックアワーなツイートを検出するモデルを提案する。
CLEF-2020 CheckThat! Task 1 System Team_AlexはMAPスコア0.8034で2位にランクされた。
論文 参考訳(メタデータ) (2020-09-07T08:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。