論文の概要: Dataset of Propaganda Techniques of the State-Sponsored Information
Operation of the People's Republic of China
- arxiv url: http://arxiv.org/abs/2106.07544v1
- Date: Mon, 14 Jun 2021 16:11:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 16:20:11.693799
- Title: Dataset of Propaganda Techniques of the State-Sponsored Information
Operation of the People's Republic of China
- Title(参考訳): 中華人民共和国の国家支援情報運用におけるプロパガンダ手法のデータセット
- Authors: Rong-Ching Chang, Chun-Ming Lai, Kai-Lai Chang, Chu-Hsing Lin
- Abstract要約: 本研究の目的は,Twitterが提供する状態支援情報操作データセットに基づいて,マンダリンに多ラベルプロパガンダ技術データセットを提供することにより,情報ギャップを埋めることである。
データセットの提示に加えて、細調整されたBERTを用いて複数ラベルのテキスト分類を適用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The digital media, identified as computational propaganda provides a pathway
for propaganda to expand its reach without limit. State-backed propaganda aims
to shape the audiences' cognition toward entities in favor of a certain
political party or authority. Furthermore, it has become part of modern
information warfare used in order to gain an advantage over opponents. Most of
the current studies focus on using machine learning, quantitative, and
qualitative methods to distinguish if a certain piece of information on social
media is propaganda. Mainly conducted on English content, but very little
research addresses Chinese Mandarin content. From propaganda detection, we want
to go one step further to provide more fine-grained information on propaganda
techniques that are applied. In this research, we aim to bridge the information
gap by providing a multi-labeled propaganda techniques dataset in Mandarin
based on a state-backed information operation dataset provided by Twitter. In
addition to presenting the dataset, we apply a multi-label text classification
using fine-tuned BERT. Potentially this could help future research in detecting
state-backed propaganda online especially in a cross-lingual context and cross
platforms identity consolidation.
- Abstract(参考訳): デジタルメディアは、計算プロパガンダとして認識され、プロパガンダが限界なくリーチを拡張する経路を提供する。
国家支援のプロパガンダは、ある政党や権威を支持する団体に対する観客の認識を形作ることを目的としている。
さらに、敵に有利になるために使われた近代的な情報戦の一部となった。
現在の研究では、ソーシャルメディア上の特定の情報がプロパガンダであるかどうかを識別するために、機械学習、量的、質的な手法を使うことに焦点が当てられている。
主に英語のコンテンツを扱うが、中国語のマンダリンのコンテンツを扱う研究はほとんどない。
プロパガンダ検出からさらに一歩進んで、適用されるプロパガンダ技術についてより詳細な情報を提供したいと思っています。
本研究では,twitterが提供する国の支援情報運用データセットに基づいて,マンダリンにおけるマルチラベルプロパガンダ技術データセットを提供することにより,情報ギャップの橋渡しを図る。
データセットの提示に加えて、微調整されたbertを用いたマルチラベルテキスト分類を適用する。
これは、国家が支援するプロパガンダを、特に言語間のコンテキストとプラットフォーム間のアイデンティティ統合で検出する将来の研究に役立つ可能性がある。
関連論文リスト
- PropaInsight: Toward Deeper Understanding of Propaganda in Terms of Techniques, Appeals, and Intent [71.20471076045916]
プロパガンダは世論の形成と偽情報の拡散に重要な役割を果たしている。
Propainsightはプロパガンダを体系的に、技術、覚醒的魅力、そして根底にある意図に分解する。
Propagazeは、人間の注釈付きデータと高品質な合成データを組み合わせる。
論文 参考訳(メタデータ) (2024-09-19T06:28:18Z) - Can GPT-4 Identify Propaganda? Annotation and Detection of Propaganda
Spans in News Articles [11.64165958410489]
これまでで最大のプロパガンダデータセットを開発し、23のプロパガンダ手法の分類に従ってテキストスパンレベルにラベル付けされた新聞記事から8K節からなる。
我々の研究は、GPT-4を用いてテキストから微細なプロパガンダ検出を行う大規模言語モデル(LLM)の性能を理解するための最初の試みである。
その結果, GPT-4の性能低下は, 段落を単にプロパガンダ的か否かの分類から, プロパガンダ技術の検出やテキストでの表現のきめ細かいタスクへと移行することが明らかとなった。
論文 参考訳(メタデータ) (2024-02-27T13:02:19Z) - Multimodal Propaganda Processing [34.295018092278255]
本稿では,マルチモーダルプロパガンダ処理の課題について紹介する。
私たちは、このタスクがAI研究者に長期的な課題をもたらし、プロパガンダの処理を成功させることで、機械による理解が人間の理解に近づく可能性があると考えている。
論文 参考訳(メタデータ) (2023-02-17T05:49:55Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - Cross-Domain Learning for Classifying Propaganda in Online Contents [67.10699378370752]
本稿では,ラベル付き文書や,ニュースやつぶやきからの文をベースとしたクロスドメイン学習の手法を提案する。
本実験は,本手法の有効性を実証し,移動過程におけるソースやターゲットの様々な構成における困難さと限界を同定する。
論文 参考訳(メタデータ) (2020-11-13T10:19:13Z) - LTIatCMU at SemEval-2020 Task 11: Incorporating Multi-Level Features for
Multi-Granular Propaganda Span Identification [70.1903083747775]
本稿では,新聞記事におけるプロパガンダ・スパン識別の課題について述べる。
本稿では,BERT-BiLSTMに基づくプロパガンダ分類モデルを提案する。
論文 参考訳(メタデータ) (2020-08-11T16:14:47Z) - Political audience diversity and news reliability in algorithmic ranking [54.23273310155137]
本稿では,ウェブサイトのオーディエンスの政治的多様性を質の指標として活用することを提案する。
ドメインの専門家によるニュースソースの信頼性評価と6,890人の米国市民の多様なサンプルによるWebブラウジングデータを用いて、より極端な、政治的に多様性の低いWebサイトが、ジャーナリストの基準を低くしていることを示す。
論文 参考訳(メタデータ) (2020-07-16T02:13:55Z) - Prta: A System to Support the Analysis of Propaganda Techniques in the
News [34.61449860876045]
Prtaでは,プロパガンダテクニックの発生するスパンをハイライトすることで,定期的にクロールされた記事の探索を可能にする。
さらに,本システムは,ユーザによって規定されたフィルタリング基準に従って,時間的および時間的,そのような手法の使用に関する統計を報告する。
ユーザーは専用のインターフェイスやAPIを通じて、どんなテキストやURLでも分析できる。
論文 参考訳(メタデータ) (2020-05-12T15:20:55Z) - Leveraging Declarative Knowledge in Text and First-Order Logic for
Fine-Grained Propaganda Detection [139.3415751957195]
本稿では,ニュース記事中のプロパガンダ的テキスト断片の検出について検討する。
本稿では,詳細なプロパガンダ手法の宣言的知識を注入する手法を提案する。
論文 参考訳(メタデータ) (2020-04-29T13:46:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。