論文の概要: BPGC at SemEval-2020 Task 11: Propaganda Detection in News Articles with
Multi-Granularity Knowledge Sharing and Linguistic Features based Ensemble
Learning
- arxiv url: http://arxiv.org/abs/2006.00593v2
- Date: Mon, 24 Aug 2020 12:34:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 12:50:11.754797
- Title: BPGC at SemEval-2020 Task 11: Propaganda Detection in News Articles with
Multi-Granularity Knowledge Sharing and Linguistic Features based Ensemble
Learning
- Title(参考訳): bpgc at semeval-2020タスク11:多面的知識共有と言語特徴に基づくアンサンブル学習を用いたニュース記事におけるプロパガンダ検出
- Authors: Rajaswa Patil, Somesh Singh and Swati Agarwal
- Abstract要約: SemEval 2020 Task-11はニュースプロパガンダ検出のための自動システムの設計を目的としている。
Task-11 は2つのサブタスク、すなわち Span Identification と Technique Classification から構成される。
- 参考スコア(独自算出の注目度): 2.8913142991383114
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Propaganda spreads the ideology and beliefs of like-minded people,
brainwashing their audiences, and sometimes leading to violence. SemEval 2020
Task-11 aims to design automated systems for news propaganda detection. Task-11
consists of two sub-tasks, namely, Span Identification - given any news
article, the system tags those specific fragments which contain at least one
propaganda technique; and Technique Classification - correctly classify a given
propagandist statement amongst 14 propaganda techniques. For sub-task 1, we use
contextual embeddings extracted from pre-trained transformer models to
represent the text data at various granularities and propose a
multi-granularity knowledge sharing approach. For sub-task 2, we use an
ensemble of BERT and logistic regression classifiers with linguistic features.
Our results reveal that the linguistic features are the strong indicators for
covering minority classes in a highly imbalanced dataset.
- Abstract(参考訳): プロパガンダは、同心の人々のイデオロギーと信念を広げ、聴衆を洗脳し、時には暴力に繋がる。
SemEval 2020 Task-11はニュースプロパガンダ検出のための自動システムの設計を目的としている。
Task-11は2つのサブタスク、すなわち Span Identification - どんなニュース記事でも、少なくとも1つのプロパガンダ技術を含む特定の断片をタグ付けし、Technical Classification - 与えられたプロパガンダのステートメントを14のプロパガンダ技術で正しく分類する。
サブタスク1では、事前学習したトランスフォーマーモデルから抽出したコンテキスト埋め込みを用いて、様々な粒度のテキストデータを表現し、多粒度知識共有アプローチを提案する。
サブタスク2では,言語的特徴を持つBERTとロジスティック回帰分類器のアンサンブルを用いる。
その結果, 言語的特徴は, 少数クラスを高度に不均衡なデータセットでカバーするための強力な指標であることが判明した。
関連論文リスト
- PropaInsight: Toward Deeper Understanding of Propaganda in Terms of Techniques, Appeals, and Intent [71.20471076045916]
プロパガンダは世論の形成と偽情報の拡散に重要な役割を果たしている。
Propainsightはプロパガンダを体系的に、技術、覚醒的魅力、そして根底にある意図に分解する。
Propagazeは、人間の注釈付きデータと高品質な合成データを組み合わせる。
論文 参考訳(メタデータ) (2024-09-19T06:28:18Z) - HuBERTopic: Enhancing Semantic Representation of HuBERT through
Self-supervision Utilizing Topic Model [62.995175485416]
本稿では,HuBERTのセマンティック表現を豊かにするための新しいアプローチを提案する。
トピックラベルを教師として使用することにより、HuBERTに補助的なトピック分類タスクを追加する。
実験の結果,本手法は,ほとんどのタスクにおいて,ベースラインと同等あるいは優れた性能を達成できることがわかった。
論文 参考訳(メタデータ) (2023-10-06T02:19:09Z) - IITD at the WANLP 2022 Shared Task: Multilingual Multi-Granularity
Network for Propaganda Detection [25.536546272915427]
本稿では,アラビア語におけるプロパガンダ検出における共有タスクの2つのサブタスクについて述べる。
Subtask 1は、与えられたツイートで使用されるプロパガンダテクニックを見つけるための多ラベル分類問題である。
Subtask 2は、ツイートに存在する各テクニックのインスタンス毎のテキストスパンを特定するように要求する。
論文 参考訳(メタデータ) (2022-10-31T10:14:43Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - Cross-Domain Learning for Classifying Propaganda in Online Contents [67.10699378370752]
本稿では,ラベル付き文書や,ニュースやつぶやきからの文をベースとしたクロスドメイン学習の手法を提案する。
本実験は,本手法の有効性を実証し,移動過程におけるソースやターゲットの様々な構成における困難さと限界を同定する。
論文 参考訳(メタデータ) (2020-11-13T10:19:13Z) - SemEval-2020 Task 11: Detection of Propaganda Techniques in News
Articles [0.6999740786886536]
本稿では,新聞記事中のプロパガンダ技術の検出に関するSemEval-2020 Task 11の結果を紹介する。
このタスクには、スパン識別と技術分類という2つのサブタスクがあった。
両方のサブタスクでは、最高のシステムはトレーニング済みのトランスフォーマーとアンサンブルを使用していた。
論文 参考訳(メタデータ) (2020-09-06T10:05:43Z) - DUTH at SemEval-2020 Task 11: BERT with Entity Mapping for Propaganda
Classification [1.5469452301122173]
本報告では,SemEval-2020 Task 11: Detection of Propaganda Techniques in News Articlesに参加するために,Democritus University of Thrace(DUTH)チームが採用した手法について述べる。
論文 参考訳(メタデータ) (2020-08-22T18:18:02Z) - LTIatCMU at SemEval-2020 Task 11: Incorporating Multi-Level Features for
Multi-Granular Propaganda Span Identification [70.1903083747775]
本稿では,新聞記事におけるプロパガンダ・スパン識別の課題について述べる。
本稿では,BERT-BiLSTMに基づくプロパガンダ分類モデルを提案する。
論文 参考訳(メタデータ) (2020-08-11T16:14:47Z) - newsSweeper at SemEval-2020 Task 11: Context-Aware Rich Feature
Representations For Propaganda Classification [2.0491741153610334]
本稿では,SemEval 2020 Task 11: Detection of Propaganda Techniques in News Articlesについて述べる。
我々は、名前付きエンティティ認識タスクのために開発されたタグ付け技術により、事前訓練されたBERT言語モデルを活用している。
第2のサブタスクでは,プロパガンダ手法の分類のために,事前学習したRoBERTaモデルにコンテキスト特徴を組み込む。
論文 参考訳(メタデータ) (2020-07-21T14:06:59Z) - Leveraging Declarative Knowledge in Text and First-Order Logic for
Fine-Grained Propaganda Detection [139.3415751957195]
本稿では,ニュース記事中のプロパガンダ的テキスト断片の検出について検討する。
本稿では,詳細なプロパガンダ手法の宣言的知識を注入する手法を提案する。
論文 参考訳(メタデータ) (2020-04-29T13:46:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。