論文の概要: ArMeme: Propagandistic Content in Arabic Memes
- arxiv url: http://arxiv.org/abs/2406.03916v2
- Date: Sun, 06 Oct 2024 08:35:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-08 18:00:50.203154
- Title: ArMeme: Propagandistic Content in Arabic Memes
- Title(参考訳): ArMeme:アラビアのミームにおけるプロパガンダ的コンテンツ
- Authors: Firoj Alam, Abul Hasnat, Fatema Ahmed, Md Arid Hasan, Maram Hasanain,
- Abstract要約: 我々は,プロパガンダ的コンテンツの手動アノテーションを用いたアラビア・ミーム・データセットを開発した。
我々は,その検出のための計算ツールの開発を目的とした包括的解析を行う。
- 参考スコア(独自算出の注目度): 9.48177009736915
- License:
- Abstract: With the rise of digital communication, memes have become a significant medium for cultural and political expression that is often used to mislead audiences. Identification of such misleading and persuasive multimodal content has become more important among various stakeholders, including social media platforms, policymakers, and the broader society as they often cause harm to individuals, organizations, and/or society. While there has been effort to develop AI-based automatic systems for resource-rich languages (e.g., English), it is relatively little to none for medium to low resource languages. In this study, we focused on developing an Arabic memes dataset with manual annotations of propagandistic content. We annotated ~6K Arabic memes collected from various social media platforms, which is a first resource for Arabic multimodal research. We provide a comprehensive analysis aiming to develop computational tools for their detection. We will make them publicly available for the community.
- Abstract(参考訳): デジタルコミュニケーションが盛んになると、ミームは文化や政治的表現の重要な媒体となり、しばしば聴衆を誤解させるのに使われるようになった。
ソーシャルメディアのプラットフォームや政策立案者、より広範な社会など、個人、組織、社会に害を与えることが多い様々な利害関係者の間で、そのような誤解を招き、説得力のあるマルチモーダルコンテンツを特定することがより重要になっている。
リソース豊富な言語(例えば、英語)のためのAIベースの自動システムを開発する努力はあったが、中級から低級のリソース言語にとっては、比較的少ない。
本研究では,プロパガンダ的コンテンツの手動アノテーションを用いたアラビア・ミーム・データセットの開発に焦点をあてた。
我々は、さまざまなソーシャルメディアプラットフォームから収集された約6Kのアラビアミームを注釈付けした。
我々は,その検出のための計算ツールの開発を目的とした包括的解析を行う。
コミュニティ向けに公開します。
関連論文リスト
- RoMemes: A multimodal meme corpus for the Romanian language [39.58317527488534]
複数のアノテーションレベルを持つ実ミームをルーマニア語でキュレートしたデータセットを導入する。
結果は、インターネットのミームに直面するとき、AIツールの処理能力を改善するためにさらなる研究が必要であることを示唆している。
論文 参考訳(メタデータ) (2024-10-20T20:26:53Z) - Propaganda to Hate: A Multimodal Analysis of Arabic Memes with Multi-Agent LLMs [7.217569932870683]
本研究では,ミームにおけるプロパガンダと憎悪の交わりについて検討する。
我々は、粗い、きめ細かい憎悪ラベルでプロパガンダ的なミームデータセットを拡張した。
我々の発見は、ミームにプロパガンダと憎悪の関連があることを示唆している。
論文 参考訳(メタデータ) (2024-09-11T13:04:34Z) - Arabic Text Sentiment Analysis: Reinforcing Human-Performed Surveys with
Wider Topic Analysis [49.1574468325115]
詳細な研究は、2002年から2020年の間に英語で出版された133のASA論文を手作業で分析する。
主な発見は、機械学習、レキシコンベース、ハイブリッドアプローチといった、ASAで使用されるさまざまなアプローチを示している。
アラビア文字SAについては、業界だけでなく学術分野でも使用できるASAツールを開発する必要がある。
論文 参考訳(メタデータ) (2024-03-04T10:37:48Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - AceGPT, Localizing Large Language Models in Arabic [73.39989503874634]
本稿では,アラビア語のテキストによる事前学習,ネイティブなアラビア語命令を利用したSFT(Supervised Fine-Tuning),アラビア語のGPT-4応答を含む総合的なソリューションを提案する。
目標は、文化的に認知され、価値に整合したアラビア語のLLMを、多様で応用特有のアラビア語コミュニティのニーズに適応させることである。
論文 参考訳(メタデータ) (2023-09-21T13:20:13Z) - Detecting and Understanding Harmful Memes: A Survey [48.135415967633676]
我々は有害なミームに焦点を当てた総合的な調査を行っている。
興味深い発見の1つは、多くの有害ミームが実際には研究されていないことである。
別の観察では、ミームは異なる言語で再パッケージ化することでグローバルに伝播し、多言語化することもできる。
論文 参考訳(メタデータ) (2022-05-09T13:43:27Z) - 3MASSIV: Multilingual, Multimodal and Multi-Aspect dataset of Social
Media Short Videos [72.69052180249598]
ソーシャルメディアプラットフォームであるMojから抽出した多言語・多言語・多言語・多言語・多言語・多言語・専門的な短いビデオのデータセットである3MASSIVを提示する。
3MASSIVは、11言語で50Kのショートビデオ(平均20秒)と100Kの未ラベルビデオで構成されている。
本稿では,3MASSIVにおけるソーシャルメディアの内容がどのように動的かつ時間的であり,意味理解タスクや言語間分析に利用することができるかを示す。
論文 参考訳(メタデータ) (2022-03-28T02:47:01Z) - M2H2: A Multimodal Multiparty Hindi Dataset For Humor Recognition in
Conversations [72.81164101048181]
テレビシリーズ『Shrimaan Shrimati Phir Se』の13話から6,191発の発声を含む会話におけるマルチモーダル・マルチパーティ・ヒンディー・ヒューム(M2H2)認識のためのデータセットを提案する。
それぞれの発話はユーモア/非感情ラベルでアノテートされ、音響、視覚、テキストのモダリティを含む。
M2H2データセットにおける実験結果から,マルチモーダル情報はユーモア認識のための単調な情報を補完することが示された。
論文 参考訳(メタデータ) (2021-08-03T02:54:09Z) - Semi-automatic Generation of Multilingual Datasets for Stance Detection
in Twitter [9.359018642178917]
本稿では,Twitterにおける姿勢検出のための多言語データセットを得る手法を提案する。
ユーザベースの情報を利用して、大量のツイートを半自動でラベル付けします。
論文 参考訳(メタデータ) (2021-01-28T13:05:09Z) - ARAACOM: ARAbic Algerian Corpus for Opinion Mining [0.0]
Webにおけるオピニオンマイニングはますます注目の的になりつつある。
本稿では,アラビア・アルジェリアの新聞における意見マイニングのためのアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-22T13:45:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。