論文の概要: Large Language Models for Multi-label Propaganda Detection
- arxiv url: http://arxiv.org/abs/2210.08209v1
- Date: Sat, 15 Oct 2022 06:47:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 18:18:02.589135
- Title: Large Language Models for Multi-label Propaganda Detection
- Title(参考訳): マルチラベルプロパガンダ検出のための大規模言語モデル
- Authors: Tanmay Chavan and Aditya Kane
- Abstract要約: マルチラベル環境下でのプロパガンダ検出処理を行うWANLP 2022共有タスクに対するアプローチについて述べる。
このタスクは、与えられたテキストを1つ以上のプロパガンダ技術を持つものとしてラベル付けするようモデルに要求する。
5つのモデルのアンサンブルがタスクで最高のパフォーマンスを示し、マイクロF1スコアは59.73%である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The spread of propaganda through the internet has increased drastically over
the past years. Lately, propaganda detection has started gaining importance
because of the negative impact it has on society. In this work, we describe our
approach for the WANLP 2022 shared task which handles the task of propaganda
detection in a multi-label setting. The task demands the model to label the
given text as having one or more types of propaganda techniques. There are a
total of 22 propaganda techniques to be detected. We show that an ensemble of
five models performs the best on the task, scoring a micro-F1 score of 59.73%.
We also conduct comprehensive ablations and propose various future directions
for this work.
- Abstract(参考訳): インターネットを通じたプロパガンダの普及は、ここ数年で激増している。
近年,社会に悪影響を及ぼすため,プロパガンダ検出の重要性が高まっている。
本研究では,マルチラベル環境下でのプロパガンダ検出処理を行うWANLP 2022共有タスクに対するアプローチについて述べる。
このタスクは、与えられたテキストを1つ以上のプロパガンダ技術を持つものとしてラベル付けするようモデルに要求する。
計22のプロパガンダ技術が検出されている。
5つのモデルのアンサンブルがタスクで最高のパフォーマンスを示し、マイクロF1スコアは59.73%である。
また, 包括的アブレーションを行い, 今後の方向性について提案する。
関連論文リスト
- PropaInsight: Toward Deeper Understanding of Propaganda in Terms of Techniques, Appeals, and Intent [71.20471076045916]
プロパガンダは世論の形成と偽情報の拡散に重要な役割を果たしている。
Propainsightはプロパガンダを体系的に、技術、覚醒的魅力、そして根底にある意図に分解する。
Propagazeは、人間の注釈付きデータと高品質な合成データを組み合わせる。
論文 参考訳(メタデータ) (2024-09-19T06:28:18Z) - Can GPT-4 Identify Propaganda? Annotation and Detection of Propaganda
Spans in News Articles [11.64165958410489]
これまでで最大のプロパガンダデータセットを開発し、23のプロパガンダ手法の分類に従ってテキストスパンレベルにラベル付けされた新聞記事から8K節からなる。
我々の研究は、GPT-4を用いてテキストから微細なプロパガンダ検出を行う大規模言語モデル(LLM)の性能を理解するための最初の試みである。
その結果, GPT-4の性能低下は, 段落を単にプロパガンダ的か否かの分類から, プロパガンダ技術の検出やテキストでの表現のきめ細かいタスクへと移行することが明らかとなった。
論文 参考訳(メタデータ) (2024-02-27T13:02:19Z) - Multimodal Propaganda Processing [34.295018092278255]
本稿では,マルチモーダルプロパガンダ処理の課題について紹介する。
私たちは、このタスクがAI研究者に長期的な課題をもたらし、プロパガンダの処理を成功させることで、機械による理解が人間の理解に近づく可能性があると考えている。
論文 参考訳(メタデータ) (2023-02-17T05:49:55Z) - Overview of the WANLP 2022 Shared Task on Propaganda Detection in Arabic [32.27059493109764]
WANLP 2022ワークショップの一環として、アラビア語のツイートでプロパガンダテクニックを検出するタスクを実行しました。
Subtask1は、マルチラベル分類問題であるツイートで使用されるプロパガンダテクニックのセットを特定するよう要求する。
Subtask2は、各プロパガンダテクニックが現れるテキストの正確なスパンと共に、ツイートで使用されるプロパガンダテクニックを検出するように要求する。
論文 参考訳(メタデータ) (2022-11-18T07:04:31Z) - Persuasion Strategies in Advertisements [68.70313043201882]
我々は,説得戦略の広範な語彙を導入し,説得戦略を付加した最初の広告画像コーパスを構築した。
次に,マルチモーダル学習による説得戦略予測のタスクを定式化する。
我々は、Fortune-500社の1600件の広告キャンペーンについて、現実世界でケーススタディを実施している。
論文 参考訳(メタデータ) (2022-08-20T07:33:13Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - Detecting Propaganda Techniques in Memes [32.209606526323945]
本稿では,ミームで使用されるプロパガンダのタイプを検出するマルチラベルマルチモーダルタスクを提案する。
950ミームの新しいコーパスを作成してリリースし、22のプロパガンダテクニックを慎重に注釈付けして、テキスト、画像、または両方に表示します。
コーパスを解析した結果,両モードを同時に理解することが,これらの手法の検出に不可欠であることが示唆された。
論文 参考訳(メタデータ) (2021-08-07T11:56:52Z) - Cross-Domain Learning for Classifying Propaganda in Online Contents [67.10699378370752]
本稿では,ラベル付き文書や,ニュースやつぶやきからの文をベースとしたクロスドメイン学習の手法を提案する。
本実験は,本手法の有効性を実証し,移動過程におけるソースやターゲットの様々な構成における困難さと限界を同定する。
論文 参考訳(メタデータ) (2020-11-13T10:19:13Z) - UPB at SemEval-2020 Task 11: Propaganda Detection with Domain-Specific
Trained BERT [0.3437656066916039]
本稿では,新聞記事コンペティションにおけるSemEval-2020, Task 11: Detection of Propaganda Techniques in News Articles competitionについて述べる。
提案手法では,プロパガンダや超党派ニュース記事に事前学習したBERTモデルを特化することを検討する。
提案システムはサブタスクSIで46.060%のF1スコアを獲得し、36チームから5位、32チームから19位、サブタスクTCで54.302%のF1スコアを記録した。
論文 参考訳(メタデータ) (2020-09-11T08:44:14Z) - LTIatCMU at SemEval-2020 Task 11: Incorporating Multi-Level Features for
Multi-Granular Propaganda Span Identification [70.1903083747775]
本稿では,新聞記事におけるプロパガンダ・スパン識別の課題について述べる。
本稿では,BERT-BiLSTMに基づくプロパガンダ分類モデルを提案する。
論文 参考訳(メタデータ) (2020-08-11T16:14:47Z) - Leveraging Declarative Knowledge in Text and First-Order Logic for
Fine-Grained Propaganda Detection [139.3415751957195]
本稿では,ニュース記事中のプロパガンダ的テキスト断片の検出について検討する。
本稿では,詳細なプロパガンダ手法の宣言的知識を注入する手法を提案する。
論文 参考訳(メタデータ) (2020-04-29T13:46:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。