論文の概要: Sina at FigNews 2024: Multilingual Datasets Annotated with Bias and Propaganda
- arxiv url: http://arxiv.org/abs/2407.09327v1
- Date: Fri, 12 Jul 2024 15:04:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-15 23:08:25.397049
- Title: Sina at FigNews 2024: Multilingual Datasets Annotated with Bias and Propaganda
- Title(参考訳): Sina at FigNews 2024: BiasとPropagandaに注釈を付けた多言語データセット
- Authors: Lina Duaibes, Areej Jaber, Mustafa Jarrar, Ahmad Qadi, Mais Qandeel,
- Abstract要約: この記事では、偏見とプロパガンダに完全に注記された12万のFacebook投稿の多言語コーパスを提示する。
コーパスは、イスラエルのガザ戦争をフレーミングするために、FigNews 2024 Shared Task on News Media Narrativesの一部として作成された。
5つの言語(アラビア語、ヘブライ語、英語、フランス語、ヒンディー語)に12,000のポストがあり、それぞれ2,400のポストがある。
- 参考スコア(独自算出の注目度): 1.1874952582465603
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The proliferation of bias and propaganda on social media is an increasingly significant concern, leading to the development of techniques for automatic detection. This article presents a multilingual corpus of 12, 000 Facebook posts fully annotated for bias and propaganda. The corpus was created as part of the FigNews 2024 Shared Task on News Media Narratives for framing the Israeli War on Gaza. It covers various events during the War from October 7, 2023 to January 31, 2024. The corpus comprises 12, 000 posts in five languages (Arabic, Hebrew, English, French, and Hindi), with 2, 400 posts for each language. The annotation process involved 10 graduate students specializing in Law. The Inter-Annotator Agreement (IAA) was used to evaluate the annotations of the corpus, with an average IAA of 80.8% for bias and 70.15% for propaganda annotations. Our team was ranked among the bestperforming teams in both Bias and Propaganda subtasks. The corpus is open-source and available at https://sina.birzeit.edu/fada
- Abstract(参考訳): ソーシャルメディア上での偏見やプロパガンダの拡散は、ますます重大な関心事となり、自動検出技術の開発に繋がる。
この記事では、偏見とプロパガンダに完全に注記された12万のFacebook投稿の多言語コーパスを提示する。
コーパスは、イスラエルのガザ戦争をフレーミングするために、FigNews 2024 Shared Task on News Media Narrativesの一部として作成された。
戦時中の2023年10月7日から2024年1月31日までの様々な行事をカバーしている。
コーパスは5つの言語(アラビア語、ヘブライ語、英語、フランス語、ヒンディー語)に12,000のポストがあり、各言語に2,400のポストがある。
注釈には法学専門の大学院生10名が含まれていた。
IAA(Inter-Annotator Agreement)はコーパスのアノテーションを評価するために用いられ、バイアスは平均80.8%、プロパガンダアノテーションは70.15%である。
私たちのチームはバイアスとプロパガンダのサブタスクで最高の成績を収めたチームです。
コーパスはオープンソースで、https://sina.birzeit.edu/fadaで入手できる。
関連論文リスト
- The FIGNEWS Shared Task on News Media Narratives [17.72844013954972]
ACL 2024と共同で開催されるアラビアNLP 2024会議の一環として組織されたFIGNEWS共有タスクの概要を紹介する。
共有タスクは多言語ニュース投稿におけるバイアスとプロパガンダアノテーションに対処する。
我々はイスラエル戦争初期のガザに関するケーススタディに焦点をあてる。
我々はこの問題を多言語の観点から解決し、英語、フランス語、アラビア語、ヘブライ語、ヒンディー語という5つの言語で解決する。
論文 参考訳(メタデータ) (2024-07-25T15:58:19Z) - Detecting Propaganda Techniques in Code-Switched Social Media Text [30.844812761448107]
コードスイッチトテキストにおけるプロパガンダのテクニックを検出するための新しいタスクを提案する。
我々は、20のプロパガンダ技術で注釈付けされた、英語とローマ・ウルドゥー語の間の1030のテキストのコーパスを作成した。
コードとデータセットはhttps://github.com/mbzuai-nlp/propaganda-codeswitched-textで公開されている。
論文 参考訳(メタデータ) (2023-05-23T21:37:26Z) - Computational Assessment of Hyperpartisanship in News Titles [55.92100606666497]
われわれはまず、超党派ニュースタイトル検出のための新しいデータセットを開発するために、人間の誘導する機械学習フレームワークを採用する。
全体的に右派メディアは比例的に超党派的なタイトルを使う傾向にある。
我々は、外国問題、政治システム、ニュースタイトルにおける過党主義を示唆する社会問題を含む3つの主要なトピックを識別する。
論文 参考訳(メタデータ) (2023-01-16T05:56:58Z) - Overview of the WANLP 2022 Shared Task on Propaganda Detection in Arabic [32.27059493109764]
WANLP 2022ワークショップの一環として、アラビア語のツイートでプロパガンダテクニックを検出するタスクを実行しました。
Subtask1は、マルチラベル分類問題であるツイートで使用されるプロパガンダテクニックのセットを特定するよう要求する。
Subtask2は、各プロパガンダテクニックが現れるテキストの正確なスパンと共に、ツイートで使用されるプロパガンダテクニックを検出するように要求する。
論文 参考訳(メタデータ) (2022-11-18T07:04:31Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - UrduFake@FIRE2021: Shared Track on Fake News Identification in Urdu [55.41644538483948]
本研究は、ウルドゥー語で偽ニュースを検出するために、UrduFake@FIRE2021と名付けられた2番目の共有タスクを報告した。
提案システムは、様々なカウントベースの特徴に基づいており、異なる分類器とニューラルネットワークアーキテクチャを使用していた。
勾配降下(SGD)アルゴリズムは他の分類器よりも優れ、0.679Fスコアを達成した。
論文 参考訳(メタデータ) (2022-07-11T19:15:04Z) - Cross-Domain Learning for Classifying Propaganda in Online Contents [67.10699378370752]
本稿では,ラベル付き文書や,ニュースやつぶやきからの文をベースとしたクロスドメイン学習の手法を提案する。
本実験は,本手法の有効性を実証し,移動過程におけるソースやターゲットの様々な構成における困難さと限界を同定する。
論文 参考訳(メタデータ) (2020-11-13T10:19:13Z) - UPB at SemEval-2020 Task 11: Propaganda Detection with Domain-Specific
Trained BERT [0.3437656066916039]
本稿では,新聞記事コンペティションにおけるSemEval-2020, Task 11: Detection of Propaganda Techniques in News Articles competitionについて述べる。
提案手法では,プロパガンダや超党派ニュース記事に事前学習したBERTモデルを特化することを検討する。
提案システムはサブタスクSIで46.060%のF1スコアを獲得し、36チームから5位、32チームから19位、サブタスクTCで54.302%のF1スコアを記録した。
論文 参考訳(メタデータ) (2020-09-11T08:44:14Z) - LTIatCMU at SemEval-2020 Task 11: Incorporating Multi-Level Features for
Multi-Granular Propaganda Span Identification [70.1903083747775]
本稿では,新聞記事におけるプロパガンダ・スパン識別の課題について述べる。
本稿では,BERT-BiLSTMに基づくプロパガンダ分類モデルを提案する。
論文 参考訳(メタデータ) (2020-08-11T16:14:47Z) - BPGC at SemEval-2020 Task 11: Propaganda Detection in News Articles with
Multi-Granularity Knowledge Sharing and Linguistic Features based Ensemble
Learning [2.8913142991383114]
SemEval 2020 Task-11はニュースプロパガンダ検出のための自動システムの設計を目的としている。
Task-11 は2つのサブタスク、すなわち Span Identification と Technique Classification から構成される。
論文 参考訳(メタデータ) (2020-05-31T19:35:53Z) - 365 Dots in 2019: Quantifying Attention of News Sources [69.50862982117125]
様々な情報源から,オンラインニュース記事の話題の重複を計測する。
ほぼリアルタイムで注目度に応じてニュースストーリーを採点する。
これにより、最も注目を集めているトピックを識別するなど、複数の研究が可能になる。
論文 参考訳(メタデータ) (2020-03-22T20:32:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。