論文の概要: UPB at SemEval-2020 Task 11: Propaganda Detection with Domain-Specific
Trained BERT
- arxiv url: http://arxiv.org/abs/2009.05289v1
- Date: Fri, 11 Sep 2020 08:44:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 21:26:01.081036
- Title: UPB at SemEval-2020 Task 11: Propaganda Detection with Domain-Specific
Trained BERT
- Title(参考訳): UPB at SemEval-2020 Task 11: Propaganda Detection with Domain-Specific Trained BERT
- Authors: Andrei Paraschiv, Dumitru-Clementin Cercel, Mihai Dascalu
- Abstract要約: 本稿では,新聞記事コンペティションにおけるSemEval-2020, Task 11: Detection of Propaganda Techniques in News Articles competitionについて述べる。
提案手法では,プロパガンダや超党派ニュース記事に事前学習したBERTモデルを特化することを検討する。
提案システムはサブタスクSIで46.060%のF1スコアを獲得し、36チームから5位、32チームから19位、サブタスクTCで54.302%のF1スコアを記録した。
- 参考スコア(独自算出の注目度): 0.3437656066916039
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Manipulative and misleading news have become a commodity for some online news
outlets and these news have gained a significant impact on the global mindset
of people. Propaganda is a frequently employed manipulation method having as
goal to influence readers by spreading ideas meant to distort or manipulate
their opinions. This paper describes our participation in the SemEval-2020,
Task 11: Detection of Propaganda Techniques in News Articles competition. Our
approach considers specializing a pre-trained BERT model on propagandistic and
hyperpartisan news articles, enabling it to create more adequate
representations for the two subtasks, namely propaganda Span Identification
(SI) and propaganda Technique Classification (TC). Our proposed system achieved
a F1-score of 46.060% in subtask SI, ranking 5th in the leaderboard from 36
teams and a micro-averaged F1 score of 54.302% for subtask TC, ranking 19th
from 32 teams.
- Abstract(参考訳): マニピュレイティブで誤解を招くニュースは、一部のオンラインニュースメディアにとってコモディティとなり、これらのニュースは世界の人々のマインドセットに大きな影響を与えている。
プロパガンダ(Propaganda)は、読者の意見の歪曲や操作を意図したアイデアを広めることによって読者に影響を与える目的を持つ操作方法である。
本稿では,新聞記事コンペティションにおけるSemEval-2020, Task 11: Detection of Propaganda Techniques in News Articles competitionについて述べる。
提案手法は,プロパガンダ・スパン識別(SI)とプロパガンダ技術分類(TC)の2つのサブタスクに対して,より適切な表現を作成できるように,プロパガンダおよび超党派ニュース記事に事前訓練されたBERTモデルを特化することを検討する。
提案システムでは,サブタスクsiで46.060%のf1スコアを達成し,36チームでリーダーボードで5位,サブタスクtcで54.302%,32チームで19位となった。
関連論文リスト
- Overview of the WANLP 2022 Shared Task on Propaganda Detection in Arabic [32.27059493109764]
WANLP 2022ワークショップの一環として、アラビア語のツイートでプロパガンダテクニックを検出するタスクを実行しました。
Subtask1は、マルチラベル分類問題であるツイートで使用されるプロパガンダテクニックのセットを特定するよう要求する。
Subtask2は、各プロパガンダテクニックが現れるテキストの正確なスパンと共に、ツイートで使用されるプロパガンダテクニックを検出するように要求する。
論文 参考訳(メタデータ) (2022-11-18T07:04:31Z) - Large Language Models for Multi-label Propaganda Detection [0.0]
マルチラベル環境下でのプロパガンダ検出処理を行うWANLP 2022共有タスクに対するアプローチについて述べる。
このタスクは、与えられたテキストを1つ以上のプロパガンダ技術を持つものとしてラベル付けするようモデルに要求する。
5つのモデルのアンサンブルがタスクで最高のパフォーマンスを示し、マイクロF1スコアは59.73%である。
論文 参考訳(メタデータ) (2022-10-15T06:47:31Z) - UrduFake@FIRE2020: Shared Track on Fake News Identification in Urdu [62.6928395368204]
本稿では、ウルドゥー語における偽ニュース検出に関するFIRE 2020における最初の共有タスクの概要について述べる。
目標は、900の注釈付きニュース記事と400のニュース記事からなるデータセットを使って偽ニュースを特定することである。
データセットには、 (i) Health、 (ii) Sports、 (iii) Showbiz、 (iv) Technology、 (v) Businessの5つのドメインのニュースが含まれている。
論文 参考訳(メタデータ) (2022-07-25T03:46:51Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2020 [62.6928395368204]
タスクはバイナリ分類タスクとして設定され、ゴールはリアルニュースとフェイクニュースを区別することである。
トレーニング用に900の注釈付きニュース記事とテスト用に400のニュース記事のデータセットを作成した。
6カ国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)の42チームが登録された。
論文 参考訳(メタデータ) (2022-07-25T03:41:32Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2021 [55.41644538483948]
共有タスクの目標は、コミュニティにこの重要な問題を解決するための効率的な方法を考え出すことを動機付けることです。
トレーニングセットには1300件の注釈付きニュース記事、750件のリアルニュース、550件のフェイクニュース、300件のニュース記事、200件のリアルニュース、100件のフェイクニュースが含まれている。
F1-macroスコアは0.679で、これは過去最高の0.907 F1-macroよりも低かった。
論文 参考訳(メタデータ) (2022-07-11T18:58:36Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - Cross-Domain Learning for Classifying Propaganda in Online Contents [67.10699378370752]
本稿では,ラベル付き文書や,ニュースやつぶやきからの文をベースとしたクロスドメイン学習の手法を提案する。
本実験は,本手法の有効性を実証し,移動過程におけるソースやターゲットの様々な構成における困難さと限界を同定する。
論文 参考訳(メタデータ) (2020-11-13T10:19:13Z) - SemEval-2020 Task 11: Detection of Propaganda Techniques in News
Articles [0.6999740786886536]
本稿では,新聞記事中のプロパガンダ技術の検出に関するSemEval-2020 Task 11の結果を紹介する。
このタスクには、スパン識別と技術分類という2つのサブタスクがあった。
両方のサブタスクでは、最高のシステムはトレーニング済みのトランスフォーマーとアンサンブルを使用していた。
論文 参考訳(メタデータ) (2020-09-06T10:05:43Z) - LTIatCMU at SemEval-2020 Task 11: Incorporating Multi-Level Features for
Multi-Granular Propaganda Span Identification [70.1903083747775]
本稿では,新聞記事におけるプロパガンダ・スパン識別の課題について述べる。
本稿では,BERT-BiLSTMに基づくプロパガンダ分類モデルを提案する。
論文 参考訳(メタデータ) (2020-08-11T16:14:47Z) - newsSweeper at SemEval-2020 Task 11: Context-Aware Rich Feature
Representations For Propaganda Classification [2.0491741153610334]
本稿では,SemEval 2020 Task 11: Detection of Propaganda Techniques in News Articlesについて述べる。
我々は、名前付きエンティティ認識タスクのために開発されたタグ付け技術により、事前訓練されたBERT言語モデルを活用している。
第2のサブタスクでは,プロパガンダ手法の分類のために,事前学習したRoBERTaモデルにコンテキスト特徴を組み込む。
論文 参考訳(メタデータ) (2020-07-21T14:06:59Z) - BPGC at SemEval-2020 Task 11: Propaganda Detection in News Articles with
Multi-Granularity Knowledge Sharing and Linguistic Features based Ensemble
Learning [2.8913142991383114]
SemEval 2020 Task-11はニュースプロパガンダ検出のための自動システムの設計を目的としている。
Task-11 は2つのサブタスク、すなわち Span Identification と Technique Classification から構成される。
論文 参考訳(メタデータ) (2020-05-31T19:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。