論文の概要: ArPoMeme: An Annotated Arabic Multimodal Dataset for Political Ideology and Polarization
- arxiv url: http://arxiv.org/abs/2605.20967v1
- Date: Wed, 20 May 2026 09:53:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.610489
- Title: ArPoMeme: An Annotated Arabic Multimodal Dataset for Political Ideology and Polarization
- Title(参考訳): ArPoMeme: 政治イデオロギーと分極のための注釈付きアラビア語マルチモーダルデータセット
- Authors: Wajdi Zaghouani, Kais Attia, Md. Rafiul Biswas, Fadhl Eryani,
- Abstract要約: 本稿では,約7300のアラビア政治ミームの大規模データセットであるArPoMemeについて述べる。
このデータセットは、これらのミームを制作し広める公開Facebookページやグループの自己識別に分類することで、アラビアのミームエコシステムの多様性を捉えている。
得られたデータセットは、視覚的内容、テキストメッセージ、イデオロギー的指向を結びつけ、政治的対立、動員、ユーモアのきめ細かい分析を可能にする。
- 参考スコア(独自算出の注目度): 1.0115311686147797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Memes have become a prominent medium of political communication in the Arab world, reflecting how humor, imagery, and text interact to express ideological and cultural positions. Despite the centrality of memes to online political discourse, there is a lack of systematically curated resources for analyzing their multimodal and ideological dimensions in Arabic. This paper presents ArPoMeme, a large-scale dataset of approximately 7,300 Arabic political memes categorized by ideological orientation, including Leftist, Islamist, Pan-Arabist, and Satirical perspectives. The dataset captures the diversity of Arabic meme ecosystems by grounding classification in the self-identification of public Facebook pages and groups that produce and disseminate these memes. To ensure both scale and accuracy, we designed a semi-automated data collection pipeline combining Playwright-based Facebook scraping with Google Drive synchronization, followed by text extraction using the Qwen2.5-VL-7B vision language model. The extracted text was manually verified and annotated for three polarization dimensions: Us vs. Them framing, Hostility toward out-groups, and Calls to action. Annotation was conducted through a custom Streamlit-based interface supporting distributed labeling, real-time tracking, and version control. The resulting dataset links visual content, textual messages, and ideological orientation, enabling fine-grained analysis of political antagonism, mobilization, and humor. Quantitative analysis of the annotated corpus reveals strong asymmetries in antagonistic framing across ideological groups, with Islamist and satirical memes exhibiting the highest levels of hostility and mobilization cues. The dataset and the annotation tool offers a reproducible and publicly available resource for studying Arabic political discourse, multimodal ideology detection, and polarization dynamics.
- Abstract(参考訳): ミームは、イデオロギーや文化的な位置を表現するためにユーモア、イメージ、テキストがどのように相互作用するかを反映して、アラブ世界の政治的コミュニケーションの顕著な媒体となっている。
オンラインの政治談話にミームが集中しているにもかかわらず、アラビア語の多様・イデオロギー的な側面を分析するための体系的な資源が不足している。
本稿では、左派、イスラム主義、パン・アラビスト、サーティリカルといったイデオロギー的指向によって分類された約7,300のアラビアの政治ミームの大規模データセットであるArPomeについて述べる。
このデータセットは、これらのミームを制作し広める公開Facebookページやグループの自己識別に分類することで、アラビアのミームエコシステムの多様性を捉えている。
スケールと精度の両方を確保するため,PlaywrightベースのFacebookスクレイピングとGoogle Drive同期を組み合わせた半自動データ収集パイプラインを設計し,続いてQwen2.5-VL-7B視覚言語モデルを用いたテキスト抽出を行った。
抽出したテキストは, Us vs. Them framing, Hostility to Out-groups, Calls to actionという3つの偏極ディメンションに対して手作業で検証,注釈付けされた。
アノテーションは、分散ラベリング、リアルタイムトラッキング、バージョン管理をサポートするStreamlitベースのカスタムインターフェースを通じて実行された。
得られたデータセットは、視覚的内容、テキストメッセージ、イデオロギー的指向を結びつけ、政治的対立、動員、ユーモアのきめ細かい分析を可能にする。
注釈付きコーパスの定量的分析では、イデオロギーグループ間の対立的フレーミングにおいて強い非対称性が示され、イスラム主義や風刺的なミームは最も高い敵意と動員の手がかりを示す。
このデータセットとアノテーションツールは、アラビアの政治談話、マルチモーダルイデオロギー検出、偏光ダイナミクスを研究するための再現性があり、公開されているリソースを提供する。
関連論文リスト
- Latent Topic Synthesis: Leveraging LLMs for Electoral Ad Analysis [51.95395936342771]
ラベルなしコーパスから解釈可能なトピック分類を自動生成するエンドツーエンドフレームワークを提案する。
われわれはこの枠組みを、2024年アメリカ合衆国大統領選挙の1ヶ月前のMeta政治広告の大規模なコーパスに適用する。
提案手法は,潜在談話構造を明らかにし,意味的に豊かなトピックラベルを合成し,モラル・フレーミングの次元でトピックを注釈する。
論文 参考訳(メタデータ) (2025-10-16T20:30:20Z) - Uncovering Conspiratorial Narratives within Arabic Online Content [0.0]
アラビアのブログやFacebookからのデータを分析して、陰謀的物語を識別し分類する。
分析の結果、性別/フェミニスト、地政学、政府のカバーアップ、黙示録、ジュード・マソニック、ジオエンジニアリングの6つのカテゴリーが明らかになった。
論文 参考訳(メタデータ) (2025-04-18T19:00:16Z) - "Whose Side Are You On?" Estimating Ideology of Political and News Content Using Large Language Models and Few-shot Demonstration Selection [5.277598111323805]
既存のイデオロギーを分類するアプローチは、大規模なデータセットのラベル付けを必要とするため、進化するイデオロギーの文脈に適応できないという点で制限されている。
本稿では、オンラインコンテンツの政治的イデオロギーを、文脈内学習を通じて、米国政治スペクトルの文脈で分類する大規模言語モデルの可能性について検討する。
論文 参考訳(メタデータ) (2025-03-23T02:32:25Z) - ArMeme: Propagandistic Content in Arabic Memes [9.48177009736915]
我々は,プロパガンダ的コンテンツの手動アノテーションを用いたアラビア・ミーム・データセットを開発した。
我々は,その検出のための計算ツールの開発を目的とした包括的解析を行う。
論文 参考訳(メタデータ) (2024-06-06T09:56:49Z) - CIVICS: Building a Dataset for Examining Culturally-Informed Values in Large Language Models [59.22460740026037]
大規模言語モデル(LLM)の社会的・文化的変動を評価するためのデータセット「CIVICS:文化インフォームド・バリュース・インクルーシブ・コーパス・フォー・ソシエティ・インパクト」
我々は、LGBTQIの権利、社会福祉、移民、障害権利、代理など、特定の社会的に敏感なトピックに対処する、手作りの多言語プロンプトのデータセットを作成します。
論文 参考訳(メタデータ) (2024-05-22T20:19:10Z) - The Face of Populism: Examining Differences in Facial Emotional Expressions of Political Leaders Using Machine Learning [50.24983453990065]
私たちは15カ国の政治指導者の220本のYouTubeビデオのサンプルをディープラーニングで処理しています。
ポピュリスト・レトリックの度合いが異なるリーダー群間での負の感情の平均スコアの統計的に有意な差を観察した。
論文 参考訳(メタデータ) (2023-04-19T18:32:49Z) - Content-based Analysis of the Cultural Differences between TikTok and
Douyin [95.32409577885645]
ショートフォームのソーシャルメディアは、聴衆にダイナミックなストーリーを伝え、彼らの注意を引き付けることによって、伝統的なメディアパラダイムから遠ざかる。
特に、興味深く、理解しやすいユニークなシーンを表現するために、日常的なオブジェクトの異なる組み合わせを用いることができる。
同じ会社によって提供されたTikTokとDouyinは、近年人気になった新しいメディアの好例だ。
メディアファッションや社会的慣用性とともに文化的な違いを表現しているという仮説が,本研究の主目的である。
論文 参考訳(メタデータ) (2020-11-03T01:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。