論文の概要: Cohesion-6K: An Arabic Dataset for Analyzing Social Cohesion and Conflict in Online Discourse
- arxiv url: http://arxiv.org/abs/2605.22447v1
- Date: Thu, 21 May 2026 13:16:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.267236
- Title: Cohesion-6K: An Arabic Dataset for Analyzing Social Cohesion and Conflict in Online Discourse
- Title(参考訳): Cohesion-6K: オンライン談話における社会的結束と対立の分析のためのアラビアデータセット
- Authors: Aisha Ali Al-Athba, Wajdi Zaghouani,
- Abstract要約: 本稿では,パレスチナのイスラエル占領に関連する6万件の公的なFacebook投稿の,手動およびChatGPTによる注釈付きデータセットを提案する。
Cohesion-6Kは、オンライン凝集と分極の研究のために透明で再現可能な資源を提供する。
- 参考スコア(独自算出の注目度): 0.6546712656847457
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The study of online discourse has become central to understanding societal polarization. While much research has focused on detecting overt toxicity, the subtle dynamics of social cohesion, meaning the interaction between divisive and unifying narratives, remain computationally underexplored (Bail, 2021; Gonzalez-Bailon and Lelkes, 2023). This paper presents Cohesion-6K, a manually and ChatGPT-assisted annotated dataset of six thousand Arabic public Facebook posts related to the Israeli Occupation of Palestine. Each post is assigned to one of five discourse categories that represent a continuum from conflict to cohesion: Conflict, Resolution, Community Engagement, Supportive Interactions, and Shared Values. The annotation process combines expert human judgment with model-assisted pre-labeling verified by trained annotators, achieving substantial inter-annotator agreement (Cohens kappa = 0.85). Quantitative analysis reveals a consistent engagement gap, where conflict-oriented posts receive between two and four times more user interaction than resolution-oriented ones (p < 0.01). This pattern illustrates how divisive discourse tends to attract disproportionate visibility in Arabic social media spaces. Cohesion-6K provides a transparent and reproducible resource for the study of online cohesion and polarization. The dataset, annotation guidelines, and preprocessing code will be released for research use under an open license, supporting future work in computational social science, digital communication, and Arabic natural language processing.
- Abstract(参考訳): オンライン談話の研究は、社会的分極の理解の中心となっている。
多くの研究は過度な毒性の検出に焦点を合わせてきたが、社会的結束の微妙なダイナミクスは、分割された物語と統一された物語の相互作用を意味し、計算的に過小評価されている(Bail, 2021, Gonzalez-Bailon and Lelkes, 2023)。
本稿では,イスラエルのパレスチナ占領に関連する6万件の公的なFacebook投稿の,手動およびチャットGPTによる注釈付きデータセットであるCohesion-6Kについて述べる。
各投稿は、紛争から結束までの継続を表す5つの談話カテゴリのうちの1つに割り当てられる:衝突、解決、コミュニティの関与、支援的相互作用、共有価値。
アノテーションプロセスは、熟練した人間の判断と、訓練されたアノテーションによって検証されたモデル支援事前ラベルとを組み合わせて、アノテータ間合意(Cohens kappa = 0.85)を実現している。
定量的分析では、コンフリクト指向の投稿が解決指向の投稿の2倍から4倍のユーザインタラクションを受け取るという、一貫したエンゲージメントギャップが明らかになっている(p < 0.01)。
このパターンは、アラビア語のソーシャルメディア空間において、ディバイシブな談話が不均等な可視性を引き付ける傾向があることを示している。
Cohesion-6Kは、オンライン凝集と分極の研究のために透明で再現可能な資源を提供する。
データセット、アノテーションガイドライン、および事前処理コードは、オープンライセンスの下で研究用にリリースされ、計算社会科学、デジタルコミュニケーション、アラビア自然言語処理における将来の研究をサポートする。
関連論文リスト
- The Rise of AI Agent Communities: Large-Scale Analysis of Discourse and Interaction on Moltbook [62.2627874717318]
MoltbookはRedditに似たソーシャルプラットフォームで、AIエージェントが投稿を作成し、コメントや返信を通じて他のエージェントと対話する。
ローンチから約5日後に収集された公開APIスナップショットを使用して、AIエージェントが何を議論しているか、どのように投稿するか、どのように相互作用するのかという3つの研究課題に対処する。
エージェントの執筆は、主に中立であり、コミュニティエンゲージメントや支援指向のコンテンツに肯定性があることが示される。
論文 参考訳(メタデータ) (2026-02-13T05:28:31Z) - Modeling Narrative Archetypes in Conspiratorial Narratives: Insights from Singapore-Based Telegram Groups [14.545582048682911]
本研究はシンガポールのTelegramグループにおける陰謀的物語を分析した。
このような内容は、孤立したエコーチャンバーに限られるのではなく、日常的な議論に織り込まれている。
分析の結果,懐疑論や不信に焦点をあてたクラスタだけでなく,財務,法律,日常生活の日常的な議論にも懐疑的なメッセージが現れることがわかった。
論文 参考訳(メタデータ) (2025-12-10T21:51:16Z) - Learning Human-Object Interaction as Groups [52.28258599873394]
GroupHOIは、幾何学的近接性および意味的類似性の観点から文脈情報を伝播するフレームワークである。
これは、より困難な非言語間相互作用検出タスクにおいて、主要なパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-10-21T07:25:10Z) - IA aplicada al análisis del conflicto Irán-Israel: Mapeo de discursos en YouTube [0.0]
この研究は、YouTubeに投稿された12万のコメントに基づいて、2025年6月に起きたイランとイスラエルの紛争のデジタル表現を分析した。
彼らは、関係するアクターに関する不正確な位置を特定し、メディアとアルゴリズムの偏見がどのようにデジタル会話を形成するかを調べることを試みた。
論文 参考訳(メタデータ) (2025-09-24T06:51:26Z) - SCALE: Towards Collaborative Content Analysis in Social Science with Large Language Model Agents and Human Intervention [50.07342730395946]
我々は、効果的に機能する新しいマルチエージェントフレームワークを導入する。
Imulates $underlinetextbfC$ontent $underlinetextbfA$nalysis via。
underlinetextbfL$arge language model (LLM) agunderlinetextbfE$nts。
テキストコーディング、協調的な議論、動的コードブックの進化など、コンテンツ分析の重要なフェーズを模倣します。
論文 参考訳(メタデータ) (2025-02-16T00:19:07Z) - Social media polarization during conflict: Insights from an ideological stance dataset on Israel-Palestine Reddit comments [0.0]
この研究は、2023年10月から2024年8月までに収集されたイスラエルとパレスチナの紛争に関するRedditのコメント9,969件を分析した。
機械学習、事前訓練された言語モデル、ニューラルネットワーク、迅速なエンジニアリング戦略など、さまざまなアプローチが、これらのスタンスを分類するために採用された。
論文 参考訳(メタデータ) (2025-02-01T12:26:11Z) - IsamasRed: A Public Dataset Tracking Reddit Discussions on Israel-Hamas Conflict [13.92311040225417]
我々は2023年8月から2023年11月までの間に、厳密にコンパイルされたデータセットIsamasRedを提示する。
このデータセットに関する最初の分析では、話題、論争、感情的、道徳的な言語傾向を時間とともに調査し、感情的に荷電され、複雑な言論の性質を強調した。
このデータセットは、オンライン議論の理解を深めることを目的としており、デジタル空間におけるイデオロギー、感情、コミュニティエンゲージメントの間の複雑な相互作用に光を当てている。
論文 参考訳(メタデータ) (2024-01-16T08:30:41Z) - Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey [71.43956423427397]
本研究の目的は,非言語的キューと計算手法を同定し,効果的な性能を実現することである。
この調査は、最も広い範囲の社会現象と相互作用設定を巻き込むことによって、相手と異なる。
もっともよく使われる非言語キュー、計算方法、相互作用環境、センシングアプローチは、それぞれマイクとカメラを備えた3,4人で構成される会話活動、ベクターマシンのサポート、ミーティングである。
論文 参考訳(メタデータ) (2022-07-20T13:37:57Z) - Dynamic Hybrid Relation Network for Cross-Domain Context-Dependent
Semantic Parsing [52.24507547010127]
ドメイン間コンテキスト依存のセマンティック解析は研究の新たな焦点である。
本稿では,コンテキストの発話,トークン,データベーススキーマ,会話の進行に伴う複雑なインタラクションを効果的にモデル化する動的グラフフレームワークを提案する。
提案したフレームワークは既存のモデルを大きなマージンで上回り、2つの大規模ベンチマークで新しい最先端性能を達成する。
論文 参考訳(メタデータ) (2021-01-05T18:11:29Z) - Is this Dialogue Coherent? Learning from Dialogue Acts and Entities [82.44143808977209]
スイッチボード・コヒーレンス・コーパス(SWBD-Coh)コーパス(Switchboard Coherence corpus,SWBD-Coh)を作成する。
コーパスの統計的分析は、ターンコヒーレンス知覚がエンティティの分布パターンによってどのように影響を受けるかを示している。
DA情報とエンティティ情報を組み合わせたモデルでは,応答選択とターンコヒーレンス評価の両面で最高の性能が得られることがわかった。
論文 参考訳(メタデータ) (2020-06-17T21:02:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。